Gå til innhold

Anbefalte innlegg

Skrevet

Jeg har en verdi som kan se slik ut.

 

12.345 eller 123 (både med ett og flere siffer)

 

Hvordan kan jeg ved hjelp av re modulen matche begge verdiene?

 

'\d*' matcher kun sistnevnte.

 

Ørjan...

Videoannonse
Annonse
Gjest Slettet-8fx0y6VV
Skrevet (endret)

hva med noe slik som dette:

 

"(\d+(\.\d+)?)"

 

>>> q = re.compile(r"(\d+(\.\d+)?)")
>>> q.match("1.45").groups()
('1.45', '.45')
>>> q.match("145").groups()
('145', None)

 

Edit: Problemet med koden til FraXinuS er at den også matcher "24.3.2.453" osv..

 

Espen

Endret av Slettet-8fx0y6VV
Skrevet

Siden dette er beløp, så vil ikke det være noen verdier med flere punktum, så viser det seg at førstnevnte fungerer greit selv om den i utgangspunktet også plukker opp '.'

 

Her er en liten test.

>>> s = 'En streng som er her, 123 er tallet. 1.234 er et annet. 21'
>>> re.findall('[\d\.]+', s)
['123', '.', '1.234', '.', '21']
>>> re.findall('(\d+(\.\d+)?)', s)
[('123', ''), ('1.234', '.234'), ('21', '')]

Ønsket resultat skulle vært [123, 1.234, 21].

Men førstnevnte fungerte i scriptet mitt.

 

En annen ting.

 

>>> t = 'START en masse ord END enda noen ord START flere ⩝ "1"END'
>>> re.findall('START.*END', t)
['START en masse ord END enda noen ord START flere ⩝ "1"END']

Ønsket resultat skulle være:

['START en masse ord END', 'START flere ⩝ "1"END']

 

Vil ha ut det som er mellom START og END. Men når det er flere på samme linje, vil den hente ut fra den første START til den siste END. Det kan være både bokstaver, tall og diverse tegn i teksten.

 

Hvordan kan denne løses?

 

Takk for hjelpen på den første. :)

 

Ørjan...

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...