저는 HTML 파서를 초보자입니다. 사실 URL (http://www.quora.com/How-many-internships-are-necessary-for-a-B-Tech-student)을 사용하여 웹 페이지의 소스 코드를 구문 분석하려고합니다. 나는 answer_count를 얻으려고하고있다.BeautifulSoup python 사용 중 오류가 발생했습니다.
나는 다음과 같은 방법으로 그것을 시도 :
import urllib2
from bs4 import BeautifulSoup
q = urllib2.urlopen(url)
soup = BeautifulSoup(q)
divs = soup.find_all('div',class_='answer_count')
하지만 목록 'div의'가 비어 얻을. 왜 그래야만하지? 내가 어디서 잘못한거야? 결과를 '2 답변'으로 사용하려면 어떻게 구현해야합니까?
answer_count 클래스를 찾을 수 없습니까? – MA1
소스 코드에 answer_count 클래스가 있습니다! 작은 패치가 있습니다 :
MA1에 동의합니다. 내가로드 한 소스에 'answer_count'가 없습니다. 나는 당신이 urllib2가 쥐고있는 것과는 반대로 로그인되어있는 것을보고 있다고 생각한다. Chrome의 시크릿 모드에서 소스를보고 계속 div가 있는지 확인해보세요. – Hooked