Twitter API 스트리밍 서버에 장기간 연결 한 지저귐 속도가 매우 빨라졌습니다. 나는 무거운 텍스트 처리를 수행하고 내 데이터베이스에 트윗을 저장합니다.Twisted 또는 Threads를 사용하여 대용량 스트리밍 데이터 처리, Python 대기열
DB에서 텍스트 처리 및 저장을 담당하는 연결 및 콜백 기능에 PyCurl을 사용하고 있습니다. 내 접근법 아래 누가 제대로 작동하지 않는지보십시오.
네트워크 프로그래밍에 익숙하지 않으므로 알고 싶습니다. 이 문제를 해결하기 위해 스레드, 대기열 또는 트위스트 프레임 워크를 어떻게 사용할 수 있습니까?
def process_tweet():
# do some heaving text processing
def open_stream_connection():
connect = pycurl.Curl()
connect.setopt(pycurl.URL, STREAMURL)
connect.setopt(pycurl.WRITEFUNCTION, process_tweet)
connect.setopt(pycurl.USERPWD, "%s:%s" % (TWITTER_USER, TWITTER_PASS))
connect.perform()
초당 메시지에서 '매우 빠름'을 정의하고 '무거운 처리'에 대해 자세히 설명합니다. – MattH
또한 "제대로 작동하지 않음"을 정의합니다. – nosklo
Upvoted for the username. 죄송합니다. 도움을받을 수 없습니다 : P –