전체 웹 페이지를 읽고 변수에 할당하려고하는데 문제가 있습니다. 이 변수는 페이지 소스의 첫 번째 512 줄 정도만 포함 할 수있는 것처럼 보입니다.전체 웹 페이지를 변수로 읽는 방법
원본의 모든 줄을 화면에 인쇄하려고했는데 원본 전체가 표시되었지만 정규식으로 파싱 할 수 있어야하므로 저장할 필요가 있습니다. 어쨌든 변수에. 도움?
data = urllib2.urlopen(url)
print data
원본의 1/3 만 제공합니다.
data = urllib2.urlopen(url)
for lines in data.readlines()
print lines
전체 소스를 제공합니다.
내가 말했듯이 정규 표현식으로 문자열을 구문 분석 할 수 있어야하지만, 필요한 부분이 처음 1/3에 있지 않아 내 변수에 저장할 수 있습니다.
[다운로드 HTML 페이지 및 해당 콘텐츠] (http://stackoverflow.com/questions/1825438/download-html-page-and-its-content) –