2012-04-23 2 views
0

cURL을 사용하여 페이지를 다운로드하고 "PHP Simple HTML DOM Parser"로 html을 구문 분석했습니다. 요소의 바깥 쪽 html을 표시 할 때 스페인어 문자가 올바르지 않습니다. 예를 들어 :스페인어 문자가 올바르지 않습니다.

원문

라 푸자 포 라 compra 드 로스 derechos 드 publicación 하 시도 라 더 읽기 reñida 델 ANO.

표시된 텍스트

라 푸자 POR 라 compra 드 로스 derechos 드 publicación HA 라 시도 más REA ± IDA 델 AA ± O.

어떤 문자가 변경 되나요?

답변

2

내가 그것을 출력에 여러 문자가 나타나는 있기 때문에이 발생하는 것을 확신 제안 싱글 바이트 문자셋 (아마도 ISO-8859-1)에 멀티 바이트 UTF8 문자를 표시하려고하기 때문입니다.

내가 전에 잠시 썼던 this blog post을 살펴보면 모든 잠재적 문제 영역을 통해 이야기해야합니다.

+0

응답 헤더 설정이 도움이되었습니다. 감사합니다. – John

1

잘못된 문자 인코딩을 참조하십시오 - 인코딩에 걸쳐 일관성이 있음을 확인, I는 UTF-8

+0

정답이지만 cURL로 확인하는 방법을 설명하지 않았으므로 나에게 아무런 도움이되지 않습니다. – John

관련 문제