Gå til innhold

Dumpe spesifikt innhold fra HTML-filer til en database


Anbefalte innlegg

Skrevet

Hei!

 

Jeg fant frem en gammel kopi av et prosjekt jeg drev med for noen år siden og kunne tenke meg å fortsette på det på hobbybases.

 

Jeg laget for lenge siden en hjemmeside med oversikt over blandt annet filmer jeg har sett, en beskrivelse, min rangering, spilletid, dato sett++++

 

Saken er at da jeg laget den så ble alt hardkodet rett inn som htmlsider per film jeg så/ville se, derfor sitter jeg igjen med en stor bunch html (med eksakt lik syntax/kode) som jeg gjerne skulle ha fått inn i en database :)

 

Jeg er ikke så rå på programmering, men av det jeg kan så er det SQL og noe php, klarer relativt lett å forstå andre (simple) språk forsåvidt. Plattform er Windows. Har jo kjørt litt linux nå og da så jeg er også villig til å forsøke meg der hvis det er en utvei!

 

Det jeg ser for meg er et eller annet script/program som leser igjennom mappene/filene og skriver ut f.eks en verdi mot CSV for hvert element som er beskrevet i HTMLen, f.eks:

 

<a font color=black>Filmnavn:</a><a font color=red>Die hard 2</a>
<a font color=black>Vurdering:</a><a font color=red>N/A</a>
<a font color=black>Beskrivelse:</a><a font color=red>Har ikke sett</a>

 

---

ny fil

---

<a font color=black>Filmnavn:</a><a font color=red>Die hard 3</a>
<a font color=black>Vurdering:</a><a font color=green>5</a>
<a font color=black>Beskrivelse:</a><a font color=red>Oppfølger til Die hard 2</a>

 

Skriver da ut følgende til en CSV-fil:

"Die hard 2";"N/A";"Har ikke sett";
"Die hard 3";5;"Oppfølger til Die hard 2";

 

Jeg regner ikke med å få hele løsningen i et svar, men om noen kunne peke meg i riktig retning, som f.eks at "Dette kan du jo lett gjøre i kommandolinje i windows via ???" så vil det være toppers!

 

PS! Det vil ikke være "mulig" å hente ut dette ved å åpne alle sidene og copy/paste informasjonen dessverre, eller det vil ihvertfall ta utrolig lang tid og jeg ønsker heller å bryne meg på en liten utfordring ved heller lage noe som gjør jobben for meg :)

 

Å importere CSVen til databasen skal jeg klare fint selv :)

 

På forhånd takk for svar!

Videoannonse
Annonse
Skrevet

Hvis kvaliteten på HTML tillater det så kan det være greit å gå via XML bibliotekene i PHP el.

 

Da kan du enten serialisere XHTML filene til objekt og hente det ut,

eller gå via konkrete XPath og gjøre det litt mer manuelt.

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...