Google에서 단순히 무언가를 검색 한 다음 결과의 개수를 반환하는 방법이 있습니까? Google의 일부 서비스 (RGoogleDocs, RGoogleData, RGoogleMaps, googleVis)를 중심으로 R 패키지를 많이 보았지만 어디서나이 기능을 찾을 수 없습니다.R : Google에서 문자열을 검색하여 조회수를 반환합니다.
답변
이것은 내가 사용하는 것이지만, 결국 단계적으로 제거되는 API 프로토콜을 기반으로합니다. 또한 속도가 제한되어 있으므로 하루에 100 건의 검색이 가능합니다. 아래 함수에서 서비스는 "web"입니다. http://code.google.com/apis/loader/signup.html (모든 URL이 작동 함)에서 키를 가져와야합니다.
GetGoogleResults <- function(keyword, service, key) {
library(RCurl)
library(rjson)
base_url <- "http://ajax.googleapis.com/ajax/services/search/"
keyword <- gsub(" ", "+", keyword)
query <- paste(base_url, service, "?v=1.0&q=", keyword, sep="")
if(!is.null(key))
query <- paste(query, "&key=", key, sep="")
query <- paste(query, "&start=", 0, sep="")
results <- fromJSON(getURL(query))
return(results)
}
그런 다음 당신에게 결과의 구조를 말할 것이다
google <- GetGoogleResults("searchTerm", "web", yourkey)
str(google)
처럼 뭔가를 할 수 있습니다. 결과의 수가 원하는 경우 google$responseData$cursor$estimatedResultCount
을 사용할 수 있습니다.
내가 말했듯이 이것은 언젠가는 스타일을 벗어날 수있는 프로토콜을 기반으로합니다. Dirk의 대답에 대신 사용할 수있는 사용자 정의 검색 엔진을 사용하는 대체 방법이 있지만 속도는 제한적입니다 (이 방법에 대한 함수를 원할 경우 noah_at_noahhl.com에서 ping을 수행 할 수 있음).
마지막으로 RCurl을 사용하여 Google에서 페이지를 가져 오는 것이지만, 구문 분석하기가 상당히 어렵습니다. 사용자 에이전트가 속이는 것을 막기 위해 Google의 시도를 스푸핑해야합니다. (이 코드를 공유 할 수도 있지만 Google에서 HTML을 수정할 때마다 문제가 발생합니다.)
당신은 Google Custom Search API 문서에서 시작하여 다음 :)를 공격하는 법을 배워야
가는 뭔가를 얻을 수있는 장소에 충분한 R 인프라가 있어야 얼마나 JSON을 참조 할 수 있습니다.
감사! 나는 그것을 들여다 볼 것입니다 –
- 1. Google에서 검색하여 특정 도메인에 대한 링크를 크롤링하는 방법은 무엇입니까?
- 2. 쿼리 문자열을 사용하여 전자 메일의 조회수를 계산합니다.
- 3. 유닉스에서 문자열을 검색하여 폴더에서 모든 파일 제거
- 4. 총 조회수를 계산하는 방법
- 5. HtmlElement.GetAttribute ("for") 빈 문자열을 반환합니다.
- 6. RealPath는 빈 문자열을 반환합니다.
- 7. HttpContext.Current.Request.Url.Host는 숫자 문자열을 반환합니다.
- 8. Textbox.value가 빈 문자열을 반환합니다.
- 9. Google에서 검색어 문자열을 검색하고 있습니다. 원하지 않습니다.
- 10. nHibernate에서 연결 문자열을 얻으면 암호없이 문자열을 반환합니다.
- 11. Google에서 R 301의 모든 링크를 업데이트하는 데 얼마나 걸립니까?
- 12. glGetShaderInfoLog 빈 문자열을 반환합니다 (안드로이드)
- 13. fql.query 메서드는 asp.net에서 빈 문자열을 반환합니다.
- 14. request.remote_ip로 perticular articule의 조회수를 생성합니다.
- 15. UrlHelper의 RouteUrl이 테스트에서 빈 문자열을 반환합니다.
- 16. BigDecimals를 사용하는 Object가 to_s에 빈 문자열을 반환합니다.
- 17. jQuery $ .post 및 json_encode는 따옴표가있는 문자열을 반환합니다.
- 18. Python : TemporaryFile은 읽을 때 빈 문자열을 반환합니다.
- 19. 텍스트를 필터링하고 #로 시작하는 문자열을 반환합니다.
- 20. mysql_real_query는 1을 반환하고, mysql_error는 NULL 문자열을 반환합니다.
- 21. Ext JS '를 사용하여 문자열을 반환합니다.
- 22. file_get_contents는 354 바이트 길이의 빈 문자열을 반환합니다.
- 23. SOLR - 근접 검색하여 문구
- 24. PHP로 검색하여 결과를 출력
- 25. Google에서 결과를 얻으려는 AJAX 요청
- 26. Google에서 "소리와 비슷한"검색어
- 27. Google에서 jQuery로 이미지 제안
- 28. Google에서 특수 문자 찾기
- 29. Google에서 OpenId FullName 검색
- 30. R 적합성 기능 R
예, Google에 API가 있음을 기억하지만 패키지를 본 기억이 없습니다. 다른 RGoogleFoo 패키지를 공부하면 요리 할 수 있습니다. –