Gå til innhold

Lese tekst fra ekstrern web-side?


Anbefalte innlegg

Hei!

 

Eg har lyst å få kun Dagens Tema frå TV2 sin værfotokonkurranse på mi eiga side så eg slepp å gå inn og scrolle ned kvar gong eg skal sjekke, er det mogleg? Det eg vil ha ut er for eksempel i dag "Til torsdag 4. februar kl 12: Vinglepetter".

 

Eg har prøvd med sånt som fopen() og file_get_contents(), men reknar med at enten så er eg heilt på vidda eller så har sidene til storm blokkert for sånt?

Lenke til kommentar
Videoannonse
Annonse

Jonas, meiner du at allow_url_fopen må være skrudd på hos meg eller hos storm?

 

Googla litt på curl og kom fram til det under, som funka flott testa på example.com, men får error når eg prøvar med den tiltenkte urlen.

 

// create a new cURL resource
$ch = curl_init();

// set URL and other appropriate options
curl_setopt($ch, CURLOPT_URL, "http://www.storm.no/fotokonkurranse/");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 2);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_RANGE, "1500-1600");

// grab URL and pass it to the browser
$buffer = curl_exec($ch);

// close cURL resource, and free up system resources
curl_close($ch);

if (empty($buffer))
{
print "Empty";
}
else
{
print $buffer;
}

 

Er dette et håplaust prosjekt, eller er eg håplaus?:)

Lenke til kommentar

nomore: Einaste feilmeldinga eg har er "An application error occurred on the server. The current custom error settings for this application prevent the details of the application error from being viewed remotely (for security reasons)."

 

 

No har eg prøvd fsockopen også, som funkar flott på f.eks www.example.com, men ikkje på www.storm.no/fotokonkurranse/ (eller www.storm.no heller).

Filnavnet har eg ikkje peiling på, reknar med det startar på index.?:)

Lenke til kommentar

storm.no har nok blokkert user-agenten til cURL, PHP, perl, etc. Om man setter noe annet som user-agent, går det helt fint.

 

<?php

// create a new cURL resource
$ch = curl_init();

// set URL and other appropriate options
curl_setopt( $ch, CURLOPT_URL, 'http://www.storm.no/fotokonkurranse' );
curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, 10 );
curl_setopt( $ch, CURLOPT_TIMEOUT, 10 );
curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 1 );
curl_setopt( $ch, CURLOPT_SSL_VERIFYPEER, 0 );
curl_setopt( $ch, CURLOPT_USERAGENT, 'Googlebot/2.1 (+http://www.google.com/bot.html)' ); 


// grab URL and pass it to the browser
$buffer = curl_exec($ch);
$buffer = str_replace( array( "\n", "\r" ), '', $buffer ); // Nasty opplegg :S
curl_close($ch);

preg_match( "#<p><b>Dagens tema </b></p><p>(.*?)</p>#i", $buffer, $mathces );

print_r( $mathces );

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...