2011-10-26 4 views
4

웹 사이트에서 AJAX/Javascripts로 제어되는 정보를 검색하기 위해 R 스크립트를 통해 브라우저 (선호하는 Firefox)를 제어하는 ​​방법을 알아 내려고합니다. 예를 들어, 필드 "Modell"의 값을 http://www.mobile.de/home/index.html에서 검색하려면 어떻게해야합니까?R에서 AJAX/Javascripts를 처리하기 위해 R에서 Firefox를 제어하는 ​​방법

AFAIU, Gabe Becker의 패키지 "RFirefox"은 Firefox와 Firefox 사이에 일종의 링크를 제공합니다. 그러나 Windows-Kid (신념으로는 아니지만 오래 지속되는 네트워크 효과 ;-))가되어 나 자신을 시도 할 수 없었으므로 나중에 할 수 있는지 확실하지 않습니다.

그래서 RFirefox 또는 R을 통해 AJAX를 처리하는 경험이있는 사람이 있습니까? 숙제를하고 싶지는 않지만 리눅스 세계로 뛰어 들기 전에 그만한 가치가 있는지 평가하고 싶습니다.

그럼에도 불구하고 모든 코드 예제는 크게 감사하겠습니다. ;-)

+0

아니 정확히 당신이 필요하지만, 유사한 http://stackoverflow.com/questions/7867105/parsing-html-and-following-a-javascript-link/7905861#7905861 –

+0

쿨, 감사에 대한 포인터! – Rappster

답변

3

브라우저를 사용해야하는 이유가 확실하지 않습니다. 그것은 단지 웹 긁기입니다. 그것은 파서의 일종을 요구할 것입니다. 물론 브라우저 일 필요는 없습니다. 나는 RFirefox가 틀린 나무를 짖고 있을지도 모른다라고 생각한다. Javascript + R 연결을 사용하려면 Duncan Temple Lang의 SpiderMonkey을 방문하십시오.

그래도 Javascript 작업에 적합한 더 심각한 크롤링/스크래핑 기능으로 데이터를 수집하는 것이 더 나을 것 같습니다. This question on SO은 특히 그와 일치하는 것처럼 보입니다. 내 권장 사항은 필요한 것을 수행하는 도구를 얻은 다음 가능하면 가장 간단한 수준에서 R과 인터페이스하는 것입니다. Webkit은 여러 언어로 바인딩되어 있습니다. R의 경우는 그렇지 않습니다.

This question은 상황을 더욱 자세히 설명합니다. Windows에서도 마찬가지입니다. Webkit은 사용하지 않습니다. 승인 된 대답의 세 가지 제안은 Python에서 C/C++로 작성된 도구에 액세스하는 것을 의미합니다. R에는 두 가지 인터페이스가 있으므로 R과 Python 또는 C/C++ 사이에서 객체와 명령어를주고받을 수있는 물건을 작성하는 것이 더 쉽습니다.

+0

조언을 주셔서 감사합니다! 나는 그들을 위해 최선의 방법이 무엇인지 알아 내기 위해 좀 더 자세히 조사 할 것이다. – Rappster

+0

좋아, 링크를 통해 스캔 : 1) 항상 장기적으로 볼 때 가장 쉬운 방법은 실제 사용자를 "시뮬레이션"하는 것일 뿐이므로 브라우저를 원격 제어한다는 생각. 2) SpiderMonkey : 그것을 놓쳐 버렸음에 틀림 없어, 포인터 주셔서 감사합니다! 3) 그 점에서 루비에 대해 어떻게 생각하십니까? 시도해 볼만한 가치가 있습니다.이 작업을 위해 Python을 사용하는 것이 더 좋습니다. – Rappster

+0

Ruby에 대한 친숙도가 매우 낮기 때문에 개인적인 결정이기는하지만 Python을 선호합니다. 질문은 파이썬으로 다소 해결 되었기 때문에 파이썬 커뮤니티에는 많은 R 동조자가 있고 (그 반대도 마찬가지입니다.) 이것이 당신에게 달려 있지만 가이드가 될 수 있습니다. – Iterator