2013-05-01 1 views
0

R을 사용하여 웹 서핑을하고 있지만 이상한 문제가 있습니다. URL 목록에 URL이 포함 된 목록이 있습니다. 여기 내 코드가getURL이 멈추어 서 기다림 기능이 필요합니다.

for (k in 1:length(URLlist)){ 
    temp = getURL(URLlist[k]) 
} 

나는 임의의 URL, R 블록을 모르겠다. 동일한 URL에 대해 루프 실행을 위해 작동 할 수 있지만 다른 루프에는 작동하지 않으므로 URL과 아무 관련이 없습니다. 나는 루프가 빠르게 진행될 것이며 데이터 다운로드가 따르지 않을 것이라고 생각한다. 그래서 getURL 함수를 호출 할 때마다 코드가 1 초 동안 기다릴 것이라고 생각했지만 기다림 함수를 찾지 못했습니다. 아무쪼록 바랍니다. 고맙습니다 ! ?

+2

나는 잘못한 것으로 묘사하는 것이 가능하다고 확신하지 않습니다. R은 단일 스레드입니다. 'getURL'을 호출 할 때마다 R은 에러가 발생하거나 완료 될 때까지 아무 것도하지 않습니다. – joran

+0

잘못 구성된 프록시를 사용하여 HTTPS 콘텐츠에 액세스하려고 할 때 R이 (가) 때로는 멈추는 경우가 있습니다. –

답변

3

Sys.sleep()

설명 :이 문제는 해결할 수 있는지 여부

time: The time interval to suspend execution for, in seconds. 

:

Suspend execution of R expressions for a given number of seconds 

사용법 :

Sys.sleep(time) 

인수 또 다른 문제.

XML 패키지를보고 htmlParse()를 사용하여 웹에서 R 서핑을하는 것이 좋습니다. HTML로 텍스트를 반환하려는 경우가 거의 없기 때문입니다.

관련 문제