트위터의 공개 타임 라인에 의존하는 웹 애플리케이션은 데이터를 얼마나 자주 수집합니까? 매분 수십만 개의 메시지가 있어야합니다. 맞습니까? 어떻게 모든 트윗을 놓치지 않고 수집 할 수 있습니까?얼마나 자주 cron을 실행하여 내 트위터 공개 일정을 잡으시겠습니까?
답변
일부 서비스 (Friendfeed는 좋은 예입니다)는 Twitter Streaming API, 즉 'Firehose'에 대한 액세스 권한이 부여됩니다. 승인과 서면 합의가 필요합니다.
트위터 API는 속도 제한이 있습니다. 공개 타임 라인 (twitter.com/public_timeline)은 동일한 의미로 요금에 제한이 없지만 매 5 초마다 업데이트되므로 대부분의 트윗은 절대 나타나지 않습니다.
트위터의 전체 피드가 호출되면서 Firehose에 액세스 할 수있는 3 개 또는 4 개의 회사가 있다고 생각합니다. FriendFeed는이 중 하나입니다. 또 하나는 Gnip입니다. Gnip은 피드를 다른 회사에 재판매합니다. 이것은 아마도 전체 트위터 피드를 얻을 수있는 유일한 방법입니다. 여기
이동합니다
http://twitter.com/help/request_whitelisting
과 흰색으로 등록 된 계정을 얻을 수는 시간당 100 개 개의 요청이 충분하지 않은 경우 (시간당 20,000 수 있습니다).
@ceejayoz 일반적으로 verify_credentials 및 rate_limit_status와 같은 몇 가지 요청을 제외하고 100 GET은 100 개의 요청을 요청하지 않습니다.
publictimeline은 더 이상 데이터를 마이닝하기에 좋은 장소가 아닙니다. Twitter는 이제 Streaming APIs을 사용하여 미친 듯이 짹짹을 출력합니다. publictimeline과 가장 가까운 비교 방법은 spritzer 메서드이지만 작은 샘플 만 포함됩니다. spritzer 방법보다 모든 (또는 그 이상) 트윗을 수집해야하는 경우 모든 공개 트윗을 반환하는 firehose 피드와 같은 다른 Streaming API (HTTP 푸시) 피드에 액세스하려면 서면 계약서에 서명해야합니다.
- 1. 라이센스를 얼마나 자주 확인합니까?
- 2. EntityManager를 얼마나 자주 만들어야합니까?
- 3. Event.RENDER가 얼마나 자주 호출됩니까?
- 4. 얼마나 자주 autoconf를 실행합니까?
- 5. 얼마나 자주 파일에 저장해야합니까?
- 6. GC는 얼마나 자주 실행됩니까?
- 7. 얼마나 자주 테이블 쿼리를
- 8. 파이썬 장식자를 얼마나 자주 사용해야합니까?
- 9. 데이터베이스 연결을 얼마나 자주 닫아야합니까?
- 10. 파이썬은 얼마나 자주 파일로 플러시됩니까?
- 11. 얼마나 자주 WSDL URL을 읽어야합니까?
- 12. 얼마나 자주 코어 데이터에 저장해야합니까?
- 13. 연속 통합 - 얼마나 자주 지속됩니까
- 14. 얼마나 자주 코드 검토를 수행해야합니까?
- 15. 얼마나 자주 Quartz Scheduler가 깨어나나요?
- 16. 얼마나 자주 QT에서 데이터베이스를 설정해야합니까?
- 17. 얼마나 자주 맞춤 이벤트를 사용합니까?
- 18. 공개 트위터 RSS 피드에는 액세스 제한이 있습니까?
- 19. CoreData 버전 관리 - 얼마나 자주 버전을 추가해야합니까?
- 20. Windows7 전화 마켓 플레이스는 얼마나 자주 업데이트됩니까?
- 21. SpriteBatch.Begin() /. End()를 얼마나 자주 호출합니까?
- 22. 마켓 앱 통계는 얼마나 자주 업데이트됩니까?
- 23. Silverlight 액세스 정책은 얼마나 자주 액세스됩니까?
- 24. 클래스의 새 인스턴스를 얼마나 자주 만들어야합니까?
- 25. Booksleeve 연결을 얼마나 자주 열고 닫아야합니까?
- 26. SQL Server 2000에서 얼마나 자주 통계를 업데이트합니까?
- 27. Form.KeyDown 이벤트에 대해 키보드를 얼마나 자주 폴링합니까?
- 28. android는 위치 업데이트를 얼마나 자주 요청합니까?
- 29. 웹 채팅 클라이언트는 업데이트를 얼마나 자주 확인해야합니까?
- 30. APNS는 얼마나 자주 장치에 메시지를 푸시하려고합니까?
twizon.com과 같은 사이트는 모든 짹짹을 얻지 못한다는 뜻입니까? – user85748
Twizon은 Twitter Search API를 사용하여 'Amazon'및 기타 관련 키워드를 검색 할 가능성이 큽니다. 그들은 공개 일정표를 철회하지 않습니다. – ceejayoz
나는 그것이 충분한 지 잘 모르겠다. URL을 짧게하고 제품에 대해 이야기하고 내 트윗에서 Amazon을 언급하지 않으면 어떨까요? 실제로, 나는 몇몇 짹짹을 검사했다, 낱말 "아마존"의 아무 언급도없고 주로 짧은 URL는 사용된다. 유일한 방법은 짹짹을 읽고, 짧은 URL을 확인하고, 긴 URL로 변환 한 다음, 아마존 (URL을 기반으로 한 제품)에 관한 짹짹을 저장하는 것입니다. 누락 된 것이 있습니까? – user85748