2011-08-13 5 views
1

file_get_contents 함수를 사용하여 원격 페이지를 구문 분석합니다. 인코딩 문제. 내가 utf-8로 사이트를 구문 분석하려고 할 때 모두 잘 작동하지만 인코딩 할 때 cp1251이면 결과가 다음에 나타납니다.인코딩에서의 구문 분석

.UA/ : , , , , , , ., , , , ,

이 기능은 페이스 북의 링크처럼 작동합니다. 사용자가 링크를 입력하고 결과를 얻습니다. 모든 인코딩에서 사이트를 구문 분석 할 수있는 함수 나 메서드가 필요합니다. 스크립트 인코딩 - UTF-8.

답변

2

시도해 볼 수있을 때까지 mb_check_encoding()을 시도하고 인코딩을 시도 할 수 있습니다.

그러나 스트림 환경이 file_get_contents() 인 비트 주위를 재생하거나 cURL을 사용하여 사이트를 가져와야합니다. 이렇게하면 헤더와 그 중 문서에 사용 된 인코딩을 얻을 수 있습니다. 인코딩을 알고 나면 convert it to UTF-8으로 쉽게 변환 할 수 있습니다.