2013-02-24 1 views
1

잘못된 XML : http://trustbox.trustpilot.com/r/travelnation.co.uk.xml내가 PHP 사용하여 XML 피드를 구문 분석하기 위해 노력하고있어 출력

이 방문을 완벽하게 확인을 보이지만, 내가

<?php 
$file = file_get_contents("http://trustbox.trustpilot.com/r/netamity.com.xml"); 
print_r($file); 
?> 

을하려고 할 때

‹•SÁŽÓ0=/ÿ`ŒÄmœ- 븊àèJV«••L«ŽmÙN²ý{Æi·M 
... 
를 얻을 수

어떻게 왜곡됩니까? Simplexml을 사용하면 파싱되지 않을 것입니다 (당연히). 헤더 UTF-8 헤더를 설정하려고했지만 문제가 get_file_contents에 있다고 생각합니다. 어떤 아이디어?

+0

다른 XML 피드와도 작동합니까? 문제가 어느 쪽인지를 확인하기 위해 먼저 확인해야 할 것입니다. –

답변

1

인코딩이 압축되어 있기 때문에 콘텐츠가 "이상한"것처럼 보입니다 (HTTP 헤더 Content-Encoding: gzip 참조).

HTTP/1.1 200 OK 
x-amz-id-2: 8wYarFnod0jtLJ3U8ZDN38102fjtG+EbwJjy0tY4YTZncrz9auEcQbzt1vyiSEhq 
x-amz-request-id: A60F1E6CA5437776 
Date: Sun, 24 Feb 2013 18:00:45 GMT 
Content-Encoding: gzip 
Last-Modified: Sun, 24 Feb 2013 05:19:11 GMT 
ETag: "64eaa6f87768aeb3ae6741ba06318cb6" 
Accept-Ranges: bytes 
Content-Type: application/xhtml+xml 
Content-Length: 52366 
Server: AmazonS3 

내가 원하는 것은 HTTP를 통해 파일을 읽는 방법을 알아야한다는 것입니다. 시도해보십시오 this one on SO.

관련 문제