2011-08-16 7 views
0

나는 file_get_contents, 컬, 간단한 HTML DOM을 사용하지만,이 URL에서 HTML을 얻을 수 없습니다 http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html왜이 URL의 HTML 코드를 가져올 수 없습니까?

나는 이유는 모르겠지만, 결과는 우연한 문자가 아닌 HTML 코드입니다.

+3

무엇이든 처음 몇 줄을 게시하면 도움이되므로, "우연한 문자"로 정확히 무엇을 의미하는지 더 잘 이해할 수 있습니다. 당신이 이해하지 못하는 것을 이해하는 사람들이 있습니다. (그것이 바로 당신이 질문을 게시 한 이유입니다, 바로 :) :) – BalusC

+0

정규 소스처럼 보입니다. – GBa

+2

코드의 일부를 올리십시오. 실제로 사용한 기능이 정보가 충분하지 않다는 것을 말하십시오. –

답변

2

당신은 빈, 컬 인코딩 자체를 처리 할 경우, CURLOPT_ENCODING를 설정해야하고 당신은 내가 아래의 코드를 테스트 한

:) 필요 정확히 그것은 올바른 문자 인코딩을 반환합니다.

$url ="http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html"; 

$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 
curl_setopt($ch, CURLOPT_ENCODING,""); 
$pagebody=curl_exec ($ch); 
curl_close ($ch); 

echo $pagebody; 
+0

예! CURLOPT_ENCODING을 사용하면 curl이 해당 URL의 HTML 코드를 가져올 수 있습니다. 내 문제가 해결되었습니다! Tuga 정말 고마워! 고마워요. 온몸이 도와 줬어! – user895921

4

웹 페이지는 (클라이언트가 지원하지 않는다고하더라도) gzip으로 인코딩 된 콘텐츠를 항상 반환하는 것처럼 보입니다. gzinflate을 사용하여 gzipped 콘텐츠를 디코딩 할 수 있습니다.

관련 문제