2012-11-07 3 views
1

저는 쿼리의 매개 변수를 충족시키는 트윗의 수를 계산해야하는 프로젝트를 진행하고 있습니다. 저는 Twython을 Twitter 인터페이스로 사용하여 Python으로 작업하고 있습니다.두 번 계산하지 않고 쿼리에서 트윗을 계산하는 방법은 무엇입니까?

몇 가지 질문이 있지만 이미 짹짹이 차지하고있는 것을 어떻게 기록합니까? 마지막 짹짹 ID를 메모하고 이전의 모든 짹짹 ID를 무시할 것입니까? - 이것의 가장 쉬운 구현은 무엇입니까?

또 다른 최적화 질문으로, 카운터에서 놓친 트윗의 수가 최소화되었는지 확인하고 싶습니다.이를 확인하는 방법이 있습니까?

고마워요.

답변

1

세트 사용을 고려해보십시오! 그들은 중복을 방지합니다.

일부 의사 : 비슷한 트윗과 리트 윗의 경우를 고려

s = set() 
for tweet in tweets: 
    s.add(tweet.id) 
0

, 내가, 전체 트윗의 의미 메모를 만드는 각 트윗의 텍스트 부분을 추출하고 사전 조회를 수행에게 추천 할 것입니다. 하지만 트윗 ID는 위에서 언급 한대로 중요한 손실과 함께 더 간단합니다.

관련 문제