나는 사이트 아래
http://www.rasekhoon.net/media/3882/page1/
의 HTML 코드를 원하는 그리고 난 다음 코드urllib2 및 아랍어 버그를 디버그하는 방법은 무엇입니까?
file = urllib2.urlopen("http://www.rasekhoon.net/media/3882/page1/")
string= file.read()
하여 얻을 나는 그것을 인쇄 할 때
<div class="header" title="ظپط§غŒظ„ظ‡ط§غŒ ط³ط¹غŒط¯ طط¯ط§ط¯غŒط§ظ†/ط³ط§ظ„ 1389 ط¨ط§ ظ…ظˆط¶ظˆط¹ 'ظ…غŒظ„ط§ط¯ طط¶ط±طھ ط²ظ‡ط±ط§ ط¹ظ„غŒظ‡ط§ ط§ظ„ط³ظ„ط§ظ…'">
<em>ظپط§غŒظ„ظ‡ط§غŒ ط³ط¹غŒط¯ طط¯ط§ط¯غŒط§ظ†/ط³ط§ظ„ 1389 ط¨ط§ ظ…ظˆط¶ظˆط¹</em>
ظ…غŒظ„ط§ط¯ طط¶ط±طھ ط²ظ‡ط±ط§ ط¹ظ„غŒظ‡ط§ ط§ظ„ط³ظ„ط§ظ…
</div>
<div class="content richcontent" style="display:none;">
난 결과 아래에 원하는
<div class="header" title="فایلهای سعید حدادیان/سال 1389 با موضوع 'مناجات'">
<em>فایلهای سعید حدادیان/سال 1389 با موضوع</em>
مناجات
</div>
<div class="content richcontent" style="display:none;">
어떻게 해결할 수 있습니까?
"어떻게 해결할 수 있습니까?" 문제는 명백하지 않습니다. – Marcin
@Marcin : 출력물이 UTF-8의 Latin-1 해석이라고 생각합니다. –
@ Marcin ok 나는 내 질문을 업데이트했다 –