meastp Skrevet 7. januar 2007 Skrevet 7. januar 2007 Hei! Hvordan går jeg frem for å fjerne html-taggene fra en liste? (her er koden, foreløpig. Henter detaljer om tv-serie® fra tv.com.) Klikk for å se/fjerne innholdet nedenfor import urllib from BeautifulSoup import BeautifulSoup class TVcom: def getEpisodes (self, adr) : self.adr = adr data = urllib.urlopen(self.adr) doc = data.read() soup = BeautifulSoup(''.join(doc)) html = soup.findAll('div', id="episode-guide") self.html = html def getNrName (self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('h1', "f-18 f-666") print data self.NrName = data def getProdnrSent(self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('span', "f-bold") print data self.ProdnrSent = data def getDescr(self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('p') #print data self.Descr = data net = TVcom() net.getEpisodes('http://www.tv.com/greys-anatomy/show/24440/episode_guide.html?season=0&tag=season_dropdown;dropdown;3') # print net.getDescr()
Gjest Slettet-8fx0y6VV Skrevet 7. januar 2007 Skrevet 7. januar 2007 Her har du noe som kan hjelpe: http://aspn.activestate.com/ASPN/Cookbook/...n/Recipe/440481 Var forresten første treff når jeg søkte "Remove html tags python" @ google Espen
meastp Skrevet 7. januar 2007 Forfatter Skrevet 7. januar 2007 Hmm.. også jeg som tilogmed var inne på ASPN og gravde etter dette. Brukte samme søkeord, men i en annen rekkefølge... Ser jo ut som om det kan være løsningen. Takk skal du ha!
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå