2011-03-11 7 views
2

나는 Twitters 공개 타임 라인에서 트윗을 사용하는 사이트를 만들고 있습니다.PHP 트윗 짹짹 Langauge

http://twitter.com/statuses/public_timeline.xml

나는 문자로 작성된 트윗하지만 모든 것을 원하는 중국어, 러시아어 등의 트윗을 원하지 않는다. ス ポ ー ツ ブ ラ ン ド PR, マ ー ケ テ ィ ン グ 0.2 児 の 母 好 き な も の :.. ユ ニ コ ー ン, 着 物, 駅 伝

내가 해봤 mb_detect_encoding UTF8하지만 여기

는 내가 원하지 않는 것의 예이다 작동하지 않습니다 ...

아이디어가 있으십니까?

두 가지 옵션이 있습니다), 중 영어 만 필터링 할 수 있습니다 트위터 API에서 해결책을 찾기;

감사

답변

0

동일한 모든 인코딩, 영어 게시물도 UTF-8에 게시물.

또는 정규식과 루프를 사용하여 게시물을 로마자가 아닌/라틴 문자로 필터링 할 수 있습니다. 이 도움이

preg_match('/[^\00-\255]+/u', $post); 

희망,

니코

0

나는 대중 타임 라인을 쿼리 할 때 언어 필터를 선언 할 수있는 방법이 있다고 생각하지 않습니다.

그러나 language 필드는 트윗을 게시 한 사용자의 공개 타임 라인 쿼리에서 반환됩니다. 꽤 높은 자신감으로 이것을 걸러 낼 수 있습니다.

2

당신은 단순히 구글 언어 API 사용할 수 있습니다

GET https://www.googleapis.com/language/translate/v2?key=INSERT-YOUR-KEY&target=de&q=Hello%20world 

을하고 JSON의 언어로 돌아갑니다 다음 official documentation에서 촬영

{ 
    "data": { 
     "translations": [ 
      { 
       "translatedText": "Hallo Welt", 
       "detectedSourceLanguage": "en" 
      } 
     ] 
    } 
} 

예, "여기를 검색하는 것은 또 다른 예이다 원본 텍스트의 언어가 자동으로 감지되는 경우 : "

+0

멋진 서늘함! 고마워. 그걸 사용할 수 있을지도 몰라. – 3rown9rince

관련 문제