2013-06-12 4 views
2

간단한 텍스트 검색과 간단한 긁기를 위해 rcurl을 사용했지만 Google 트렌드에 난처한 상황입니다. obama & romney를 예로 들어 보겠습니다. "& 내보내기 = 1"을 추가하면 Google 검색 트렌드는 그래프의 기본 데이터를 표시하는 페이지를 반환합니다. 해당 페이지에 rcurl & innerHTML/innertext (Google 동향을 R으로 긁어 모으기)

http://www.google.com/trends/explore?q=obama%2C+romney#q=obama%2C%20romney&export=1

는, 데이터는 당신이 요소를 검사하여 검사 할 수있는 reportContent의 DIV에 살고 : 그것이 innerHTML을하고 멀리 자리 잡고 구체적

<div id="reportContent" class="report-content"> </div> 

해당 div와 관련된 innertext 속성 & 전에 rcurl을 사용하여 데이터에 액세스하는 방법을 궁금해지기 전에 이것을 본 적이 없습니다. 또한 궁금한 점이 있습니다. 아무도 모를 경우 왜 Google은 간단한 html로 데이터를 표시하지 않는 것입니까? 나는 잘 알지 못한다는 것을 인정할 것이다. 내가 할 수있는 한 많이 읽고있다. 그러나 innertext 속성 (별로는 아님)에 대해 알아 낸 점은 특히 내 rcurl 스크립트를 수정하는 데 도움이되거나 도움이되지 않는다.

+1

CSV 형식으로 다운로드하지 않는 이유는 무엇입니까? (위 URL의 경우) : http://www.google.com/trends/trendsReport?hl=ko-KR&q=obama%2C%20romney&export=1&content=1 – daroczig

+0

방법을 알지 못했습니다 - 감사합니다! 당신이 내 질문에 대답했습니다. – Don

+0

GTurnds라는 패키지가 최근에 RCurl 라이브러리를 기반으로 작성되었으며 현재 수행하려는 작업을 수행해야합니다. [** Just Another R Blog **] (http://anotherrblog.blogspot.com/2013/06/introducing-gtrendsr.html) – hvollmeier

답변

0

여러 트렌드 데이터를 얻으려면 google에 로그인해야합니다. 그렇지 않으면 Google에서 쉽게 차단할 수 있습니다. Google은 나를 차단할 때 여러 가지 요소를 고려할 수 있습니다. IP 주소/Google 계정/기기 유형/기계 또는 인간.

나는 http://www.datadriver.info/scrapdata/?case_task_id=b333f048be31cad3922f1c8c919700f860f5adbe에 온라인 google 동향 근근이 살아가고 서비스를 제공합니다.이 서비스를 사용하면 "귀하의 할당량 한도에 도달했습니다. 나중에 다시 시도하십시오."라는 지루한 문제가 발생하지 않습니다.

관련 문제