약 200,000 개의 엔티티 목록이 있으며 각 엔티티에 대해 특정 RESTful API를 쿼리하고 JSON 형식으로 저장된 모든 200,000 개의 엔티티로 끝내야합니다. txt 파일. 순진한 방법으로 200,000 개의 엔티티 목록을 살펴보고 하나씩 쿼리하고, 반환 된 JSON을 목록에 추가하고, 완료되면 텍스트 파일을 모두 보냅니다. 같은 뭔가 : API에 20 만 쿼리가 약 10 시간 정도 걸릴 것 같은많은 수의 쿼리를 텍스트 파일에 작성하기
from apiWrapper import api
from entities import listEntities #list of the 200,000 entities
a=api()
fullEntityList=[]
for entity in listEntities:
fullEntityList.append(a.getFullEntity(entity))
with open("fullEntities.txt","w") as f:
simplejson.dump(fullEntityList,f)
는 분명히 이것은, 신뢰할 수 없습니다, 그래서 그것을 파일에 기록하기지기 전에 뭔가 오류가 발생합니다 같아요. 올바른 방법은 청크로 작성하는 것이지만 구현 방법은 확실하지 않습니다. 어떤 아이디어? 또한 데이터베이스로는이 작업을 수행 할 수 없습니다. 그들이에서 와서
작업 대기열에서 약간 확장 할 수 있습니까? 어떤 모듈을 사용해야합니까? 문서에 대한 링크? – leonsas
링크가 이미 위에 있습니다 ... 그리고 모듈은'대기열' – wim