Gå til innhold

Kode for analysering av bilder?`


Anbefalte innlegg

Hei!

 

Jeg studerte et prosjekt jeg fant på planetsourcecode og fant koden veldig interresant.

Man "lærer" altså et program å lese bilder, altså tegn på bilder.

Det samme som programvaren til scanneren min bruker når jeg bruker "scan-text" funksjonen.

Dette er jo ikke opensource, og siden den koden jeg fant var skrevet i feil språk.

Spør jeg heller her om litt info, finnes det noen opensource prosjekter med vel-fungerene kode til å lese tegn fra bilder?

Lenke til kommentar
Videoannonse
Annonse

Et alternativ når man skal gjenkjenne objekter i bilder er å bruke kunstige nevrale nettverk (artificial neural network). Kort fortalt har du et sett med input-noder der hver node f.eks. kan representere en byte i bildet. I tillegg har du et sett med output-noder, som f.eks. sier om det er et fly eller en bil som er på bildet. Mellom disse har en et sett med skjulte noder, og alle nodene er knyttet sammen med et sett vekter.

 

For å bestemme verdien på de ulike vektene trenger du et sett med treningsdata, der du vet verdien på både input- og output-nodene.

 

Det finnes en rekke ulike implementasjoner av kunstige nevrale nettverk. Legg merke til at de ikke trenger å være laget spesielt for bildegjenkjenning for at du skal kunne ha nytte av dem. Jeg har dessverre ikke noen spesiell implementasjon å anbefale.

 

Mer info: http://en.wikipedia.org/wiki/Artificial_neural_network

Lenke til kommentar

Oh, takk for linken.

Skal se på det, men jeg må begynne et sted.

Jeg har lest dette, og lurer på et par ting.

 

Når jeg åpner en fil i binary-mode, altså uten formatering eller hva det heter hvordan fordeler jeg det i en datastruktur så headeren havner på rett sted?

Skal google etter ferdig kode.

 

Bitmap, er ukomprimert iallefall. Det har jeg forstått.

Enklere sagt, hvordan vet jeg hvilken versjon av "bitmap" jeg åpner?

Lenke til kommentar
Når jeg åpner en fil i binary-mode, altså uten formatering eller hva det heter hvordan fordeler jeg det i en datastruktur så headeren havner på rett sted?

Skal google etter ferdig kode.

9038462[/snapback]

 

Jeg vet ikke hvilket språk du bruker og er ikke helt sikker på hva du spør om, men hjelper dette?

 

sBMPHeader	BmpHeader;
sBMP  BmpInfoHeader;

fread (&BmpHeader,1,sizeof(sBMPHeader),fFile);
fread (&BmpInfoHeader,1,sizeof(sBMP),fFile);

 

Bitmap, er ukomprimert iallefall. Det har jeg forstått.

Enklere sagt, hvordan vet jeg hvilken versjon av "bitmap" jeg åpner?

9038462[/snapback]

 

I bitmap info blokka (Windows V3) så må du lese av compresjons infoen og hvis den er BI_RGB så er fila ukomprimert og hvis den er noe annet så er den komprimert på en eller annen måte.

 

Hvis version du mener hvilke info header filen har så må du lese den første dword verdien i infoheaderen og så bruken den til å finne riktig infoheader.

 

Til bmp leseren min så bruker jeg bare Windows V3 info header og har aldri funnet en fil som bruker noe annet, men de finnes. :(

 

Lykke til

 

 

edit:

Nei, og atter nei.

Giddion, jeg så du skrev noe, gimme?

9039087[/snapback]

 

voldsomt til mas da :D

Endret av Giddion
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...