한 사이트에서 웹 페이지를 일괄 적으로 다운로드하고 싶습니다. 내 'urls.txt'파일에는 5000000 개의 URL 링크가 있습니다. 그것은 약 300M입니다. 다중 스레드가 이러한 URL을 연결하고 이러한 웹 페이지를 다운로드하는 방법은 무엇입니까? 또는 어떻게 이러한 웹 페이지를 다운로드 할 수 있습니까?파이썬, 멀티 스레드, 웹 페이지 가져 오기, 웹 페이지 다운로드
내 아이디어 :
with open('urls.txt','r') as f:
for el in f:
##fetch these urls
또는 트위스트?
좋은 해결책이 있습니까?
당신이 직접 프로그램 하시겠습니까 체크 아웃? 'wget'로 쉽게 할 수 있습니다. – notnoop