2014-06-23 2 views
0

fangraphs.com에서 많은 데이터를 사용하는 스프레드 시트가 있습니다. 여기웹 내보내기 가능한 스프레드 시트에서 데이터 가져 오기

http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=0&season=2014&month=0&season1=2013&ind=0&team=0&rost=0&age=0&filter=&players=0

또 다른 예는 다음과 같습니다 : http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=0&season=2014&month=13&season1=2013&ind=0&team=0&rost=0&age=0&filter=&players=0

그래서 내 스프레드 시트에서 나는 데이터를 포함하는 탭이 여기에 내가 사용하고있는 데이터 세트 중 하나의 예입니다 해당 웹 사이트에서 "데이터 내보내기"를 선택하면됩니다. 현재 데이터를 업데이트 할 때 사이트로 이동하여 각 스프레드 시트를 수동으로 내 보내어 주 시트의 탭에 붙여 넣어야합니다.

주 시트에 내보낼 수있는 시트의 데이터로 자동으로 두 개의 탭을 자동으로 업데이트 할 수 있습니까? 친구가 R을 사용할 수 있다고 언급 했으므로 다운로드했지만, 어떻게해야 할지를 스스로 알 수는 없습니다.

미리 감사드립니다. 자세한 내용이 필요하면 알려주세요.

답변

0

당신은 테이블의 일부 행을 놓치지 않도록 팀마다 팀을 다운로드해야 할 수 있습니다 : 당신은 배울 필요가 없습니다 를 예를 들어 천사 (= 1 팀)

library(XML) 
x=readHTMLTable(doc = "http://www.fangraphs.com/leaders.aspx?pos=p&stats=bat&lg=all&qual=0&type=0&season=2014&month=0&season1=2013&ind=0&team=1&rost=0&age=0&filter=&players=0") 
x[[33]] 
+0

:

당신은이 질문은 또한 몇 가지 힌트를 제공 https://code.google.com/p/selenium-vba

을 확인, 당신이 이미 알고있는 언어의 브라우저 자동화 스크립트를 작성할 수 있습니다 , 사이트에서 직접 읽고 한 번에 하나의 팀으로 이동하는 것이 좋습니다. – fullOfQuestions

+0

명확화를 위해'library (XML)'을 추가 할 수 있습니다. –

+0

@fullOfQuestions 네, 제안입니다. 아니지만 정말 추천. 그러나 문제에 대한 가능한 해결책. – RockScience

0

에 대한 완전히 새로운 언어 (이 경우 R)를 사용하여 작업을 완료하십시오.

기본적으로 브라우저 자동화 스크립트 (클릭, 대기, 데이터 반입)를 작성하거나 웹 페이지를 "스크랩"하려고합니다. 대신 모든 행을 얻기 위해 내보낼 시트를 사용하는, 그래서 다른 말로 How to download the contents of a paginated Jquery/JS table?

관련 문제