2009-05-24 4 views

답변

2

일부 서비스 (Friendfeed는 좋은 예입니다)는 Twitter Streaming API, 즉 'Firehose'에 대한 액세스 권한이 부여됩니다. 승인과 서면 합의가 필요합니다.

1

트위터 API는 속도 제한이 있습니다. 공개 타임 라인 (twitter.com/public_timeline)은 동일한 의미로 요금에 제한이 없지만 매 5 초마다 업데이트되므로 대부분의 트윗은 절대 나타나지 않습니다.

트위터의 전체 피드가 호출되면서 Firehose에 액세스 할 수있는 3 개 또는 4 개의 회사가 있다고 생각합니다. FriendFeed는이 중 하나입니다. 또 하나는 Gnip입니다. Gnip은 피드를 다른 회사에 재판매합니다. 이것은 아마도 전체 트위터 피드를 얻을 수있는 유일한 방법입니다. 여기

+0

twizon.com과 같은 사이트는 모든 짹짹을 얻지 못한다는 뜻입니까? – user85748

+0

Twizon은 Twitter Search API를 사용하여 'Amazon'및 기타 관련 키워드를 검색 할 가능성이 큽니다. 그들은 공개 일정표를 철회하지 않습니다. – ceejayoz

+0

나는 그것이 충분한 지 잘 모르겠다. URL을 짧게하고 제품에 대해 이야기하고 내 트윗에서 Amazon을 언급하지 않으면 어떨까요? 실제로, 나는 몇몇 짹짹을 검사했다, 낱말 "아마존"의 아무 언급도없고 주로 짧은 URL는 사용된다. 유일한 방법은 짹짹을 읽고, 짧은 URL을 확인하고, 긴 URL로 변환 한 다음, 아마존 (URL을 기반으로 한 제품)에 관한 짹짹을 저장하는 것입니다. 누락 된 것이 있습니까? – user85748

1

이동합니다

http://twitter.com/help/request_whitelisting

과 흰색으로 등록 된 계정을 얻을 수는 시간당 100 개 개의 요청이 충분하지 않은 경우 (시간당 20,000 수 있습니다).

@ceejayoz 일반적으로 verify_credentials 및 rate_limit_status와 같은 몇 가지 요청을 제외하고 100 GET은 100 개의 요청을 요청하지 않습니다.

2

publictimeline은 더 이상 데이터를 마이닝하기에 좋은 장소가 아닙니다. Twitter는 이제 Streaming APIs을 사용하여 미친 듯이 짹짹을 출력합니다. publictimeline과 가장 가까운 비교 방법은 spritzer 메서드이지만 작은 샘플 만 포함됩니다. spritzer 방법보다 모든 (또는 그 이상) 트윗을 수집해야하는 경우 모든 공개 트윗을 반환하는 firehose 피드와 같은 다른 Streaming API (HTTP 푸시) 피드에 액세스하려면 서면 계약서에 서명해야합니다.

관련 문제