2012-10-14 5 views
0

나는 tweepy를 사용하여 프로젝트의 유명인에 관한 트윗을 스트리밍하고 캡처하여 절반의 데이터가 영어로되어 있지 않음을 깨달았습니다 (지금은 분석을 위해 영어로 표시해야 함). 그래서 내가 트위터의 언어를 기반으로 스트리밍을 필터링 할 수있는 방법이 있습니까?Tweepy를 사용하여 언어를 기반으로 트윗 짹짹

답변

0

불행히도 스트리밍 데이터에는 ISO 언어 코드가 포함되어 있지 않으므로 언어를 직접 감지하는 유일한 방법이라고 생각합니다 (this answer 도움이 될 수 있음). 스트리밍중인 데이터의 양에 따라 먼저 데이터를 저장 한 다음 언어를 감지하고 원하지 않는 모든 데이터를 삭제하는 두 번째 프로세스가 필요할 수 있습니다.

+0

감사합니다. 가능합니다. – roopalgarg

+1

language 매개 변수는 스트리밍 문서 페이지에서 발표되었지만 아직 작동하지 않습니다. https://dev.twitter.com/docs/streaming-apis/parameters#language – Sushant