Mazeking Skrevet 6. mars 2006 Skrevet 6. mars 2006 Skal lagre en haug med dokumenter etter scanning. Er dog usikker på hva slags format det er mest hensiktmessig å lagre alt i. i Tenkte i utgangspunktet på å lagre alt som PDF, men jeg er dog usikker på om PDF kan være et krongletet format hvis jeg får lyst til å publisere disse dokumentene på web? Hadde et XML format vært bedre? Lar XML seg greit integrere med bilder og illustrasjoner eller er Xml kun for tekst? Noen som har noen synspunkter på dette? Alle de scannede dokumentene blir kjørt igjennom en OCR program slik at jeg kan søke i innholdet i teksten
endrebjo Skrevet 6. mars 2006 Skrevet 6. mars 2006 (endret) XML er et språk for å beskrive og strukturere data, ikke presentere det. Når du har et bilde i en XML-fil ligger dette mest sannsynlig som en ekstern bildefil med en link i XML-filen. PDF er et format for å presentere data likt på alle mulige systemer verden over og er veldig utbredt på internett (så godt som alt av datablader, større publikasjoner, dokumentasjon osv. er publisert som PDF). Endret 6. mars 2006 av endrebjorsvik
Mazeking Skrevet 6. mars 2006 Forfatter Skrevet 6. mars 2006 XML er et språk for å beskrive og strukturere data, ikke presentere det. Når du har et bilde i en XML-fil ligger dette mest sannsynlig som en ekstern bildefil med en link i XML-filen. PDF er et format for å presentere data likt på alle mulige systemer verden over og er veldig utbredt på internett (så godt som alt av datablader, større publikasjoner, dokumentasjon osv. er publisert som PDF). 5711307[/snapback] Da sier det seg selv at jeg bør holde meg til PDF :-)
Mazeking Skrevet 8. mars 2006 Forfatter Skrevet 8. mars 2006 Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene.
endrebjo Skrevet 8. mars 2006 Skrevet 8. mars 2006 Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene. 5720243[/snapback] Hva mener du?OCR konverterer jo scannede bokstaver til ren tekst på PCen. Er det fonten du vil endre? Er det håndskrevne eller maskinskrevne dokumenter du scanner?
Mazeking Skrevet 8. mars 2006 Forfatter Skrevet 8. mars 2006 Er det mulig under scanning til PDF å få erstattet all scannet tekst med ren tekst via OCR? Fontene på en tekst etter scanning er sjelden pene. 5720243[/snapback] Hva mener du?OCR konverterer jo scannede bokstaver til ren tekst på PCen. Er det fonten du vil endre? Er det håndskrevne eller maskinskrevne dokumenter du scanner? 5721150[/snapback] Det er maskinskrevene dokumenter. Når jeg scanner disse blir teksten lagret som bitmap i tillegg til at den gjøres søkbar med OCR. Ønsker å gjøre all denne bitmap teksten om til REN tekst. Kun bilder fra scanningen skal beholdes. Bruker Adobe Acrobat Professional 7.0
endrebjo Skrevet 8. mars 2006 Skrevet 8. mars 2006 Du må nok letet litt i enten Adobe Acrobat eller scanneprogrammet ditt og se om du finner et konverteringsverktøy eller noe liknende. Hvis Adobe Acrobat har mulighet til å søke gjennom det via OCR må det kunne konvertere hele dokumenter til teksfiler også kan jeg tenke meg. Kanskje det er et valg i scanneprosessen. Hvordan blir XML-filene seende ut når du scanner dem da? Hvis du kun skal ha teksten kan det være et alternativ.
Mazeking Skrevet 8. mars 2006 Forfatter Skrevet 8. mars 2006 Du må nok letet litt i enten Adobe Acrobat eller scanneprogrammet ditt og se om du finner et konverteringsverktøy eller noe liknende.Hvis Adobe Acrobat har mulighet til å søke gjennom det via OCR må det kunne konvertere hele dokumenter til teksfiler også kan jeg tenke meg. Kanskje det er et valg i scanneprosessen. Hvordan blir XML-filene seende ut når du scanner dem da? Hvis du kun skal ha teksten kan det være et alternativ. 5723256[/snapback] Dette med XML var kun et spørsmål fra min side på om det hadde en større bruksverdi en PDF. Jeg har kun til nå scannet i PDF men siden det var såpass mange dokumenter som skal ha lang levetid så ville lurte jeg på om den ene var med mer framtidsrettet og fleksibelt enn det andre. Derfor spørsmålet om PDF vs XML.
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå