2016-07-20 2 views
12

site을 구문 분석해야하지만 403 금지됨 오류가 표시됩니다.Python 요청입니다. 403 Forbidden

url = 'http://worldagnetwork.com/' 
result = requests.get(url) 
print(result.content.decode()) 

출력 :

<html> 
<head><title>403 Forbidden</title></head> 
<body bgcolor="white"> 
<center><h1>403 Forbidden</h1></center> 
<hr><center>nginx</center> 
</body> 
</html> 

가, 문제가 무엇인지 말 해주세요 는 여기에 코드입니다.

답변

38

페이지가 User-Agent을 식별하지 않는 GET 요청을 거부하는 것 같습니다. 나는 브라우저 (크롬)와 페이지를 방문하여 GET 요청의 User-Agent 헤더 (개발자 도구의 네트워크 탭에서 볼) 복사 :

import requests 
url = 'http://worldagnetwork.com/' 
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} 
result = requests.get(url, headers=headers) 
print(result.content.decode()) 

# <!doctype html> 
# <!--[if lt IE 7 ]><html class="no-js ie ie6" lang="en"> <![endif]--> 
# <!--[if IE 7 ]><html class="no-js ie ie7" lang="en"> <![endif]--> 
# <!--[if IE 8 ]><html class="no-js ie ie8" lang="en"> <![endif]--> 
# <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 
# ... 
+0

매우 감사를! –

+0

나를 위해 일한, 감사합니다 –

+0

그 오류가 나를 위해 팝업 시작 왜 이해가 안돼, 그것은 몇 시간 전에 일하고 있었다. 하지만 솔루션은 완벽하게 작동했습니다. 감사합니다! – rodrigorf