Gå til innhold

hente ut teksten fra et PDF dokument


Anbefalte innlegg

Hei, dette haster litt folkens.

Jeg har et scannet tekst-dokument som jeg må redigere på.

 

Husker fra hardy heron at jeg bare kunne merke teksten på dokumentet (pdf) i dokumentvisningsprogrammet. Får altså ikke dette til i 10.04. finnes det et program som kan fikse dette?

har prøvd http://www.free-ocr.com/, men den klarte ikke en tabell.

 

Takker for raske svar!

 

(nb. må få gjort det til imorgen :ermm: )

Lenke til kommentar
Videoannonse
Annonse

Du kan merke teksten på vanlig måte i 10.04 hvis det faktisk er tekst i dokumentet. Det varierer litt om skanneprogrammer kjører OCR og legger tekst inn i dokumentet sammen med bildet, men i ditt tilfelle er det sannsynligvis ikke gjort. Dvs. at hele PDF-filen bare er et stort bilde (av arket) uten tilhørende tekst.

Da må du bruke OCR. Wikipedia har en sammenlikning av diverse programmer. Kanskje CuneiForm kan være verdt å prøve?

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...