Gå til innhold

XML vs PDF. Fleksibel måte å lagre dokumenter på?


Anbefalte innlegg

Skrevet

Skal lagre en haug med dokumenter etter scanning. Er dog usikker på hva slags format det er mest hensiktmessig å lagre alt i. i

Tenkte i utgangspunktet på å lagre alt som PDF, men jeg er dog usikker på om PDF kan være et krongletet format hvis jeg får lyst til å publisere disse dokumentene på web? Hadde et XML format vært bedre? Lar XML seg greit integrere med bilder og illustrasjoner eller er Xml kun for tekst? Noen som har noen synspunkter på dette?

 

Alle de scannede dokumentene blir kjørt igjennom en OCR program slik at jeg kan søke i innholdet i teksten

Videoannonse
Annonse
Skrevet (endret)

XML er et språk for å beskrive og strukturere data, ikke presentere det. Når du har et bilde i en XML-fil ligger dette mest sannsynlig som en ekstern bildefil med en link i XML-filen.

 

PDF er et format for å presentere data likt på alle mulige systemer verden over og er veldig utbredt på internett (så godt som alt av datablader, større publikasjoner, dokumentasjon osv. er publisert som PDF).

Endret av endrebjorsvik
Skrevet
XML er et språk for å beskrive og strukturere data, ikke presentere det. Når du har et bilde i en XML-fil ligger dette mest sannsynlig som en ekstern bildefil med en link i XML-filen.

 

PDF er et format for å presentere data likt på alle mulige systemer verden over og er veldig utbredt på internett (så godt som alt av datablader, større publikasjoner, dokumentasjon osv. er publisert som PDF).

5711307[/snapback]

 

Da sier det seg selv at jeg bør holde meg til PDF :-)

Skrevet

Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene.

Skrevet
Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene.

5720243[/snapback]

Hva mener du?

OCR konverterer jo scannede bokstaver til ren tekst på PCen. Er det fonten du vil endre?

 

Er det håndskrevne eller maskinskrevne dokumenter du scanner?

Skrevet
Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene.

5720243[/snapback]

Hva mener du?

OCR konverterer jo scannede bokstaver til ren tekst på PCen. Er det fonten du vil endre?

 

Er det håndskrevne eller maskinskrevne dokumenter du scanner?

5721150[/snapback]

 

Det er maskinskrevene dokumenter. Når jeg scanner disse blir teksten lagret som bitmap i tillegg til at den gjøres søkbar med OCR. Ønsker å gjøre all denne bitmap teksten om til REN tekst. Kun bilder fra scanningen skal beholdes.

 

Bruker Adobe Acrobat Professional 7.0

Skrevet

Du må nok letet litt i enten Adobe Acrobat eller scanneprogrammet ditt og se om du finner et konverteringsverktøy eller noe liknende.

Hvis Adobe Acrobat har mulighet til å søke gjennom det via OCR må det kunne konvertere hele dokumenter til teksfiler også kan jeg tenke meg.

Kanskje det er et valg i scanneprosessen.

 

Hvordan blir XML-filene seende ut når du scanner dem da? Hvis du kun skal ha teksten kan det være et alternativ.

Skrevet
Du må nok letet litt i enten Adobe Acrobat eller scanneprogrammet ditt og se om du finner et konverteringsverktøy eller noe liknende.

Hvis Adobe Acrobat har mulighet til å søke gjennom det via OCR må det kunne konvertere hele dokumenter til teksfiler også kan jeg tenke meg.

Kanskje det er et valg i scanneprosessen.

 

Hvordan blir XML-filene seende ut når du scanner dem da? Hvis du kun skal ha teksten kan det være et alternativ.

5723256[/snapback]

 

 

Dette med XML var kun et spørsmål fra min side på om det hadde en større bruksverdi en PDF. Jeg har kun til nå scannet i PDF men siden det var såpass mange dokumenter som skal ha lang levetid så ville lurte jeg på om den ene var med mer framtidsrettet og fleksibelt enn det andre. Derfor spørsmålet om PDF vs XML.

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...