2014-04-22 1 views
0

내 스크립트 작업이 훌륭하지만, 오늘 체크 인 로그 후에 일부 분석 한 결과, utf8로 파일이 분석되고 제목이 추출되었지만 결과가 분석 된 후 일부 행렬 단어가 발견됨 대신 러시아어 단어이다 (СÐμÑ € DD ° Ð»Ñ <Ð ¢ Ð £ D는! СÐμÑ € DD를 ¢) 내가 사용preg_match UTF-8 문제 cyrilic 대신 알 수없는 기호

를 알 수없는 문자

$cont = "dasdas<title>Сериалы ТУТ! Сериалы онлайн sda</title>"; 
preg_match("'<title[^>]*?>(.*)</title>'siU", $cont, $match); 

//$match[1] = Сериалы ТУТ! СериРsda 

때 패턴 수정 자/u를 추가하려고하면 변경 사항이 없습니다. 동일한 알 수없는 행렬 단어입니다. 부디.

PHP에 뭔가가있을 수 있습니까?

+2

[재생할 수없는 (https://eval.in/139968). 이것을 일반 (신선한) PHP 파일에서 테스트하고 있습니까? – HamZa

+2

이렇게하면 예상대로 출력됩니다. – hwnd

+0

@HamZa, 예, 온라인 파서에서 재현하려했는데 모든 것이 원활하게 작동하지만 google에 대한 정보가 없기 때문에 문제가 preg_match가 아니라 다른 레벨에있을 수 있습니다. –

답변

2

이것은 PHP 또는 정규식 문제가 아니지만 html 문제입니다. 올바른 표시를 얻으려면 html 코드의 헤더에 <meta charset="UTF-8"/>을 추가해야합니다. 여담 주석으로

다음 U 개질제를 사용 쓸모 :

preg_match('~<title[^>]*>(.*?)</title>~si', $cont, $match); 
+0

감사합니다 ^^ kjj –