위키피디아의 특정 페이지 urlopen
을 시도 할 때 이상한 버그가 있습니다.파이썬의`urllib2` : 위키 피 디아 페이지를`urlopen '할 때 왜 403 오류가 발생합니까?
>>> f = urllib2.urlopen('http://en.wikipedia.org/wiki/OpenCola_(drink)')
Traceback (most recent call last):
File "C:\Program Files\Wing IDE 4.0\src\debug\tserver\_sandbox.py", line 1, in <module>
# Used internally for debug sandbox under external interpreter
File "c:\Python26\Lib\urllib2.py", line 126, in urlopen
return _opener.open(url, data, timeout)
File "c:\Python26\Lib\urllib2.py", line 397, in open
response = meth(req, response)
File "c:\Python26\Lib\urllib2.py", line 510, in http_response
'http', request, response, code, msg, hdrs)
File "c:\Python26\Lib\urllib2.py", line 435, in error
return self._call_chain(*args)
File "c:\Python26\Lib\urllib2.py", line 369, in _call_chain
result = func(*args)
File "c:\Python26\Lib\urllib2.py", line 518, in http_error_default
raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 403: Forbidden
이 다른 대륙에서 두 개의 서로 다른 시스템에 내게 일어난 :
http://en.wikipedia.org/wiki/OpenCola_(drink)
이 쉘 세션 :이 페이지입니다. 왜 이런 일이 일어나는 지 아는 사람이 있습니까?
당신은 그 괄호를 URL 인코딩 할 수 있습니다 당신에게 HTML 코드를 반환합니다. 그것은 403에 대해 도움이되지는 않지만. – Thomas
wikimedia API의 링크를 사용할 수도 있습니다. https://www.mediawiki.org/wiki/API:Main_page – chackerian