2010-02-13 3 views
0

주어진 URL에서 키워드 밀도를 감지하는 PHP 스크립트가 있습니다.php5 인코딩 : 터키어 문자를 감지하지 못했습니다.

내 문제는 터키 문자를 감지하거나 삭제하지 않는다는 것입니다.

나는 file_get_contents 방법으로 URL의 내용을 가져오고 있습니다. 이 방법은 완벽하게 작동하며 모든 콘텐츠를 터키 문자로 가져옵니다.

내 코드 here을 보거나 스크립트 here을 사용해 볼 수 있습니다.

답변

2

file_get_contents 데이터를 UTF-8 (아마도 올바르게)로 가져 와서 변환하는 것 같지만 HTML 페이지가 자체 인코딩을 지정하지 않습니다. 아마도 들어오는 양식 데이터는 iso-8859-1에 있습니다. 뿐만 아니라 페이지의 인코딩으로 utf-8을 지정하십시오 :

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 

그리고 의무적 인 독서 링크를 인코딩 기본에 : The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

+0

는 지정하지만 여전히 같은 문제가 발생합니다. 문자열 메서드와 같은 스크립트의 다른 메서드에 관한 것 같습니다. 예를 들어 www.google.com.tr을 http://www.gazihanisildak.com/keyword에서 시도 할 수 있습니다. – user272483

+0

링크에 오류 메시지가 표시됩니다. System veritabani ile baglanti kuramadi –

+0

죄송합니다. 이제 작동합니다 – user272483

관련 문제