저는 교육 웹 사이트를 구문 분석해야하는 파싱 프로젝트를 진행하고 있습니다. 이렇게하는 동안 내 코드는 University of Goa 사이트를 구문 분석 할 수 없습니다. 예상대로 반환되지 않습니다. 내 코드 :BeautifulSoup이 (가) Goa University 사이트를 구문 분석 할 수 없습니다.
from bs4 import BeautifulSoup
import requests
hdrs = {'User-Agent': 'Mozilla/5.0 (X11 Linux x86_64) AppleWebKit/537.36 (\
KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}
r = requests.get(url, verify=True, headers=hdrs)
result = BeautifulSoup(r.content)
print(result)
그것은 인쇄 :
대신 원시 HTML의<html><head><script type="text/javascript">
document.location="https://www.unigoa.ac.in/result_redirect.php";
</script>
</head></html>
트리를 구문 분석. 나는 explicity parser lxml
과 html5lib
을 BeautifulSoup에 전달하려고 시도했지만 예상대로 작동하지 않습니다. 친절하게 도와주세요. 미리 감사드립니다.
그건 * 원시 파싱 된 HTML 트리입니다. html 파일에 저장하고 브라우저에서 열어보십시오 ... (그냥 무엇을하는지 이해하기 위해) – zvone