Amos Skrevet 8. februar 2007 Skrevet 8. februar 2007 Jeg skal lage en struktur som leser navn fra en tekstfil og som teller antall ganger dette navnet forekommer i filen. Hvilken datastruktur vil være best egnet til dette? Tenker da både i forhold til å enkelhet med å kode og kjøretid (er ganske mange og store filer)
Ainemorko Skrevet 8. februar 2007 Skrevet 8. februar 2007 Regular expressions vil fungere bra til matching og søking
___ Skrevet 8. februar 2007 Skrevet 8. februar 2007 Har du noen eksempler på hvordan tekstfilene ser ut? Er det noe spesielt format? Hilsen Werner
Amos Skrevet 8. februar 2007 Forfatter Skrevet 8. februar 2007 Takk for de svarene jeg har fått! Skal teste HashMap... Har du noen eksempler på hvordan tekstfilene ser ut? Er det noe spesielt format? Hilsen Werner 7900932[/snapback] Filene er stort sett prosjektrapporter som inneholder masse tekst og en noen få navn. Tekstfilene er opprinnelig i .doc format, men skal finne en måte å konvertere disse til .txt. Har sett litt på POI, men inntil videre konverterer jeg filene manuelt en fil om gangen. Hvis noen kjenner til program for å batch-konvertere mange .doc filer til plain text, setter jeg pris på et hint
krigun Skrevet 8. februar 2007 Skrevet 8. februar 2007 Eller du kan bruke Lucene (http://lucene.apache.org/java/docs) for å indeksere filene dine, og søke i dem etterpå. Det skal være fullt mulig å indeksere doc filer også.
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå