1
간단한 웹 스크래핑 프로그램에서 작업하고 있지만 단순한 페이지 집합을 다운로드하여 크기를 줄 수없는 것처럼 보입니다.ThreadPoolExecutor를 사용하여 오류 웹 스크래핑
from concurrent.futures import ThreadPoolExecutor as Executor
urls = """reddit twitter tumblr instagram linkedin""".split()
def fetch(url):
from urllib import request, error
try:
data = request.urlopen(url).read()
return '{}: length {}'.format(url, len(data))
except error.HTTPError as e:
return '{}: {}'.format(url, e)
with Executor(max_workers=4) as exe:
template = 'http://www.{}.com'
jobs = [exe.submit(
fetch, template.format(u)) for u in urls]
results = [job.result() for job in jobs]
print('\n'.join(results))
명령 줄에서 내가
python scrape.py
을 실행하는거야하지만 난
Traceback (most recent call last): File "scrape.py", line 1, in from concurrent.futures import ThreadPoolExecutor as Executor ImportError: No module named concurrent.futures
내가 무엇을해야합니까 오류를 받고 있어요 : 여기
내 코드입니다 이 오류를 극복하려면 어떻게해야합니까?
2.7에는 백 포트는 없습니까? – wogsland
https://pypi.python.org/pypi/futures (면책 조항 : 한번도 시도한 적이 없습니다.) – alexanderlukanin13
시도 할 수 없습니다. 고맙습니다! – wogsland