0
나는 tweepy를 사용하여 프로젝트의 유명인에 관한 트윗을 스트리밍하고 캡처하여 절반의 데이터가 영어로되어 있지 않음을 깨달았습니다 (지금은 분석을 위해 영어로 표시해야 함). 그래서 내가 트위터의 언어를 기반으로 스트리밍을 필터링 할 수있는 방법이 있습니까?Tweepy를 사용하여 언어를 기반으로 트윗 짹짹
나는 tweepy를 사용하여 프로젝트의 유명인에 관한 트윗을 스트리밍하고 캡처하여 절반의 데이터가 영어로되어 있지 않음을 깨달았습니다 (지금은 분석을 위해 영어로 표시해야 함). 그래서 내가 트위터의 언어를 기반으로 스트리밍을 필터링 할 수있는 방법이 있습니까?Tweepy를 사용하여 언어를 기반으로 트윗 짹짹
불행히도 스트리밍 데이터에는 ISO 언어 코드가 포함되어 있지 않으므로 언어를 직접 감지하는 유일한 방법이라고 생각합니다 (this answer 도움이 될 수 있음). 스트리밍중인 데이터의 양에 따라 먼저 데이터를 저장 한 다음 언어를 감지하고 원하지 않는 모든 데이터를 삭제하는 두 번째 프로세스가 필요할 수 있습니다.
감사합니다. 가능합니다. – roopalgarg
language 매개 변수는 스트리밍 문서 페이지에서 발표되었지만 아직 작동하지 않습니다. https://dev.twitter.com/docs/streaming-apis/parameters#language – Sushant