2013-08-21 2 views
1

나는 PHP-file_get_contents를 가진 거미 웹 사이트 내용에 배우고있다, 그러나 무언가는 틀리다. 나가 원하는 웹은 "http://www.jandan.net"이다.file_get_content 틀린 웹을 얻으십시오

하지만 file_get_content()을 사용하면 콘텐츠가 "http://i.jandan.net"(전화 페이지, 다른 페이지)입니다. user_agent도 사용할 수 없습니다.

<?php 
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6"); 
$url = 'http://www.jandan.net/'; 
/* 
$opt = array('http'=>array(
'method'=>"GET", 
'header'=>"User-Agent: Mozilla/5.0\n" 
) 
); 
$context = stream_context_create($opt); 
*/ 
$content = file_get_contents($url); 
echo var_dump($content); 
?> 
+1

두 URL은 나를 위해 잘 작동하고 있습니다. 아니면 중국어 404 페이지를 잘못 해석합니까? –

+1

file_get_contents 대신 [curl] (http://php.net/manual/en/curl.examples.php)을 사용 했습니까? curl로 사용자 에이전트를 변경하는 것이 문제가되면 매우 간단합니다. _curl_setopt ($ ch, CURLOPT_USERAGENT, '') _ –

+0

* "file_get_content()"를 사용하십시오. *'file_get_contents()';-)'($ url,)'에서 쉼표를 제거하는 것만으로 오류가 발생합니다. –

답변

0

$content = file_get_contents($url,);의 쉼표로 인해 문제가 발생합니다.

---------------------------------------------- ---------------------------^original posted code ---^

다음과 같은 오류가 발생합니다 쉼표를 유지에서

메시지 :

Parse error: syntax error, unexpected ')' in.....(folder path etc.)

빠른 참고 : 사용 $url = 'http://i.jandan.net/';도했다 표시된 컨텐츠를 얻었다.

이 시도 :

<?php 
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6"); 
$url = 'http://www.jandan.net/'; 

/* 
$opt = array('http'=>array(
'method'=>"GET", 
'header'=>"User-Agent: Mozilla/5.0\n" 
) 
); 
$context = stream_context_create($opt); 
*/ 
$content = file_get_contents($url); 
echo var_dump($content); 
// echo $content; 
?>