surrehue Skrevet 11. mai 2006 Skrevet 11. mai 2006 Hei Jeg har planer om å lage en crawlrer eller en robot som kan søke gjennom flere forhåndsdefinerte sider. Ved hjelp av regler og filtre skal den kunne finne frem til f.eks en tabell om inneholder noen verdier jeg ønsker å hente ut å putte i en database. Er det noen som har ideer, vet om noe liknede som har blitt laget før eller har noen tips på gode metoder/funksjoner for å lage en slik crawler?
Peter Skrevet 11. mai 2006 Skrevet 11. mai 2006 file_get_contents er en god start deretter kan du velge om du vil bruke regex eller strengefunksjoner for å navigere frem til innholder du skal ha. For sistenevnte er nok strpos og substr en fin miks. Lykke til!
surrehue Skrevet 12. mai 2006 Forfatter Skrevet 12. mai 2006 Tusen takk for veldig nyttige tips! Er det noen som kjenner til noen verktøy som har blitt laget på dette området, altså konfigurerbare crawlere for å hente spesifikk informasjon på en nettside?
surrehue Skrevet 12. mai 2006 Forfatter Skrevet 12. mai 2006 Google...hva er det for noe . Har tittet litt rundt, men tenkte kanskje at noen her hadde laget noe liknede før og kunne delen noen erfaringer og kunnskaper rundt det.
The Red Devil Skrevet 14. mai 2006 Skrevet 14. mai 2006 Php er ikkje det beste programmerings språket for å lage crawlere. Men som sagt tidligere du kan bruke file_get_contents du kan også bruke sockets, curl eller DOM det er alt etter kva du er ute etter på siden og vil lagre. Kvar av dei funksjonene har sine fordelere, men du kan jo lese opp om dei på php.net
Darkshade Skrevet 23. mai 2006 Skrevet 23. mai 2006 (endret) Her er noen crawlere http://phpdig.net http://www.htdig.org http://wiki.apache.org/jakarta-lucene/PoweredBy Endret 23. mai 2006 av kylefj
Torbjørn Skrevet 23. mai 2006 Skrevet 23. mai 2006 jeg ville brukt perl, det ligner på php men kan faktisk brukes til dette
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå