BeautifulSoup, Scrapy e.t.c에 대해 이야기하는 웹 스크래핑과 관련하여 많은 답변을 읽었습니다. 웹 스크래핑을 수행합니다.웹 페이지 소스를 저장하는 고유 한 방법
웹 브라우저에서 페이지 원본을 저장하는 것과 동일한 방법을 사용할 수 있습니까?
즉, 파이썬에서 웹 사이트를 가리키고 페이지의 소스를 표준 파이썬 모듈만으로 텍스트 파일에 저장하는 방법이 있습니까? 여기
내가에 도착 어디에 :
import urllib
f = open('webpage.txt', 'w')
html = urllib.urlopen("http://www.somewebpage.com")
#somehow save the web page source
f.close()
별로 나는 알고있다 - 그러나 나는 그것을 쓸 수 있도록 코드를 찾는 것은 실제로 페이지의 소스를 당깁니다. 나는 urlopen이 연결 만한다는 것을 모은다.
아마도 웹 페이지의 행을 읽는 데 readlines()가 해당합니까? 당신은 urllib2
을 시도 할 수
에 오신 것을 환영합니다! [귀하의 질문을 연구하십시오] (http://stackoverflow.com/questions/how-to-ask). [이미 시도한 것] (http://whathaveyoutried.com/)이 있으면 질문에 추가하십시오. 아니라면 질문을 먼저 연구하고 시도한 다음 다시 방문하십시오. –
감사! 이 사이트에 여전히 아주 새롭기 때문에 미안하다. 내가 가지고있는 코드를 추가 할 것이다. –