2012-07-19 3 views
4

나는 특정 기간 내에 트윗을 올린 국가에서 온 트윗을 얻을 수있는 프로젝트를 진행 중이다. 그 후에 데이터 마이닝을 할 것입니다. (긍정적 인 생각이 특정 학생에게 얼마나 많은가 등을 말합니다.) Java를 프로그래밍 언어로 사용하고 싶습니다. 그러나 나는이 프로젝트를 시작하는 방법을 모른다. 나는 검색을했고 나는이 있음을 알고자바에서 특정 기간 내에 모든 트윗 가져 오기

일정 기간 내에 특정 국가에서 올 수있는 경우 모든 트윗을 얻을 수 있습니다. 몇 가지 예는 다음과 같습니다. 사용자 이름을 제공하고 공개 프로필 인 경우 트윗을 반환합니다. 나는 모든 공개 프로필 목록을 가지고 있지 않습니다. 그 문제를 어떻게 처리해야합니까?

아이디어가 있으십니까?

답변

7

자바를 사용한다면 Twitter4j가 가장 좋습니다.

하지만 원하는 트윗을 검색하기위한 전략을 선택해야합니다.

Twitter에서 데이터를 가져 오거나 전체 Firehose 액세스 권한이있는 데이터 제공 업체에서 가져올 수 있습니다. DataSift 및 Gnip은 Firehose에 대한 모든 액세스 권한을 가진 공급자입니다. 데이터 공급자 DataSift를 사용하려면 자체 쿼리 언어로 인해 매우 멋진 방법입니다.

혼자서 데이터를 가져 오는 경우. 첫째로 당신은 당신이 트위터 스트리밍 API를 사용할 필요가 실시간으로 트윗을 얻기 위해 원하는 Twitter4j 그것이 정말 쉽게 불행하게도 스트리밍 API는 국가 또는 언어 filtering.You를 지원하지 않습니다 어쨌든 다 했지 사용할 수있게 경우

  • 수 등록 된 검색 쿼리에 대한 Streaming API를 수신합니다.

  • 두 번째 옵션은 검색 API입니다 .witter4j는 검색 API를 매우 쉽게 사용합니다. 검색 API는 훨씬 더 많은 필터링 옵션을 지원합니다. 그러나 국가에 따라 트윗을 필터링 할 수있는 방법이 없습니다. 언어은 훨씬 더 유용합니다. 예 : en, fr 등의 트윗을 필터링합니다.

희망이 있습니다.

+0

데이터 교환기에서 트윗을 얻으려면 돈을 지불해야합니까? 파이어 호스로 트위터에 신청할 수 있습니까? datasift 또는 이와 비슷한 것을 사용할 때마다 나는 그들이 트위터에 올 때마다 세계의 모든 트윗을 얻을 수 있습니까? – kamaci

+0

트위터 Firehose는 선택된 파트너 만 액세스 할 수 있습니다. 당신이 매우 심각한 회사가 아니면 신청할 수 없습니다. :) 현재의 트윗과 과거 트윗 모두에 액세스하려면 Datasift를 사용하십시오.하지만 그냥 사용하려는 경우 현재 트윗은 필터링을 위해 필요한 것을 가지고 있지만 Twitter 스트리밍 API를 사용합니다. –

+0

그냥 Serdar에 추가 - 스트리밍 API는 파이어 호스와 비교하여 트윗의 매우 작은 하위 집합을 제공합니다. –

0

search API을 사용하고 싶습니다. 그러나 API는 국가 별 검색을 허용하지 않으며 지오 코드로만 검색 할 수 있습니다.

+0

스트리밍 API는 어떻습니까? – kamaci

0

in Twitter4J

다음과 같은 위치를 얻을 수 있습니다.

tweet.getUser().의 getLocation()

그러나 그것은 사용자의 위치 입력 필드를 가져옵니다.

관련 문제