2010-04-15 6 views
6

urllib2를 사용하여 URL을 엽니 다. 이제 html 파일이 문자열로 필요합니다. 어떻게해야합니까?urllib2 ~ 문자열

+0

문자열을 가져 왔을 때 무엇을하고 싶습니까? 최상의 솔루션은 파일을 문자열로 읽는 것을 포함하지 않을 수도 있습니다. –

답변

10

가장 쉬운 방법은 다음과 같습니다 urllib2 docs에 자세한 내용이 있습니다

f = urllib2.urlopen("http://example.com/foo/bar") 
s = f.read() 
# s now holds the contents of the site 

.

urlopen()은 파일과 유사한 객체를 반환하므로 파이썬의 file object methods이 작동합니다.

+0

감사합니다. 저건 완벽 해. –

1
>>> import urllib2 
>>> s = urllib2.urlopen('http://www.google.com').read() 
>>> s 
<big long string here> 
7

바이너리 모드 .read() 메소드의 반환은 그 urllib.request.openurl('http://www.example.com/').read().decode('utf-8')로 변경되어야한다.

관련 문제