2011-07-28 5 views
0

아래 명령을 사용하여 데이터를 다운로드하려고합니다.urllib.urlretrieve가 실패했습니다.

import urllib 
url = 'http://www.nse-india.com/content/historical/EQUITIES/2002/MAR/cm01MAR2002bhav.csv.zip' 
urllib.urlretrieve(url, 'myzip') 

What I see in the file generated file my.zip is, 

You don't have permission to access "http&#58;&#47;&#47;www&#46;nse&#45;india&#46;com&#47;content&#47;historical&#47;EQUITIES&#47;2002&#47;MAR&#47;cm01MAR2002bhav&#46;csv&#46;zip" on this server.<P> 
Reference&#32;&#35;18&#46;7d427b5c&#46;1311889977&#46;25329891 

는하지만 이것에 대한 이유는 어떤 문제 없이 웹 사이트에서 파일을 다운로드 할 수 있어요.

답변

0

urllib2을 사용하고 user-agent 헤더를 인식해야 할 수도 있습니다. 일반 사용자로 보이지 않는 항목은 차단 될 수 있습니다.

+0

Mozilla에서와 같이 사용자 에이전트로 시도했지만 여전히 동일한 문제가 있으며 [link] (http://code.activestate.com/recipes/572202-web-browser-emulator/)를 사용해 보았습니다. 다운로드되지만 여분의 바이트가있어 손상된 것입니다. – kanna

+0

코드가 아닌 해당 제조법의 다른 헤더를 사용해보십시오. – agf

관련 문제