Gå til innhold

Hvordan fjerne flere nonlatin-1-tegn i en string


Anbefalte innlegg

Skrevet

Sitter med eit lite problem der eg får input-data som skal vere latin-1, men eg har oppdaga at det har komme inn tegn som ikkje er latin-1.Tanken er at alle tegn som ikkje er i latin-1 tegnsettet skal byttes ut med '_'.

Er det noko effektiv måte å gjere dette på eller må eg lage ein eigen algoritme for å sjekke kvart tegn for at tegnet er eit Latin-1 tegn,

Videoannonse
Annonse
Skrevet

Når dei kjem inn blir tegna omsatt til latin-1

encode_temp = unicode(orh_navn,'latin-1').encode('latin-1')

Tegna skal i utganspunktet vere latin-1, men så testdataene viste var det plutseleg andre ukjente tegn i rekka.

tegn: 0x85 

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...