2016-10-25 1 views
1

XML2 패키지를 사용하여 ESPN.com에서 일부 테이블을 긁어 냈습니다. 예를 위해, 나는 R에 주 7 판타지 쿼터백 순위를 긁어 싶습니다 URL은 어떤 :R의 Webscraping, "... 현재 작업 디렉터리에 없습니다"오류

http://www.espn.com/fantasy/football/story/_/page/16ranksWeek7QB/fantasy-football-week-7-quarterback-rankings

내가 사용하려고 해요 "read_html을()"함수 그것이 내가 가장 잘 알고있는 것이기 때문에 이것을하십시오. 여기 내 구문과 그 오류입니다 :

> wk.7.qb.rk = read_xml("www.espn.com/fantasy/football/story/_/page/16ranksWeek7QB/fantasy-football-week-7-rankings-quarterbacks", which = 1) 
Error: 'www.espn.com/fantasy/football/story/_/page/16ranksWeek7QB/fantasy-football-week-7-rankings-quarterbacks' does not exist in current working directory ('C:/Users/Brandon/Documents/Fantasy/Football/Daily'). 

왜 R이 작업이 URL을 찾고있다 :

> wk.7.qb.rk = read_html("www.espn.com/fantasy/football/story/_/page/16ranksWeek7QB/fantasy-football-week-7-rankings-quarterbacks", which = 1) 
Error: 'www.espn.com/fantasy/football/story/_/page/16ranksWeek7QB/fantasy-football-week-7-rankings-quarterbacks' does not exist in current working directory ('C:/Users/Brandon/Documents/Fantasy/Football/Daily'). 

나는 또한 시도 "read_xml()"한이 단지 같은 오류가 발생합니다 예배 규칙서? 나는 다른 URL과 함께이 기능을 시도했고 성공했다. 이 특정 URL이 다른 위치와 다른 위치에서 보이게하는 것은 무엇입니까? 그리고 그것을 어떻게 바꿀 수 있습니까?

+3

URL이 불완전합니다. 그것은'http'로 시작해야합니다. 고쳐 그것을 잘 작동합니다. – alistaire

답변

1

20 페이지를 탐색하기 위해 루프에서 read_html을 실행하는 동안이 오류가 발생했습니다. 20 번째 페이지 이후에도 루프는 여전히 URL없이 실행 중이므로 다른 루프 반복을 위해 NAs와 함께 read_html을 호출하기 시작했습니다. 도움이 되었으면합니다.

관련 문제