여기 내 코드가 있습니다. 여러분도 테스트해볼 수 있습니다. 나는 항상 페이지 원본 대신 혼란스런 문자를 얻는다.urllib2를 사용하여 url을 여는 중 왜 엉뚱한 문자가 나옵니까?
Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}
Req = urllib2.Request("http://rlslog.net", None, Header)
Response = urllib2.urlopen(Req)
Html = Response.read()
print Html[:1000]
는 일반적으로 Html
페이지 소스해야하지만, 그것은 엉망 업 문자 t로 끝났다. 왜 그런지 압니까?
은 BTW : 나는 당신은 플라이 압축을 지원하는 사용자 에이전트와 요청을 파이썬 2.7
문제가 저에게 잘 작동합니다. 문제는 다른 곳에서 발생해야합니다. 응답을 출력하는 방식에 어떤 간단한 실수가있을 수 있습니까? – Kapep
@kapep : 정말입니까? 난 그냥 'HTML [: 100]'을 인쇄하면 엉망이됩니다. 어떤 파이썬 버전입니까? – Shane
인쇄 부분이 포함되지 않았기 때문에 그것은 단지 야생 추측이었습니다. 나를 위해 예상대로 작동합니다. 2.6.4 사용하기. – Kapep