BeautifulSoup 4를 통해 Share per earnings 데이터를 this page에서 추출하려고합니다.BeautifulSoup4 : 파싱 된 테이블 데이터가 누락되었습니다.
데이터를 구문 분석 할 때 기본값 인 lxml
과 HTML 5 파서를 사용하면 테이블 정보가 누락됩니다. 나는 이것이 Javascript와 관련이 있으며 나는 PyV8
을 구현하여 스크립트를 BS4 용으로 읽을 수있는 HTML로 변환하려고 노력하고 있다고 생각한다. 문제는 여기에서 어디로 가야할지 모르겠다.
실제로 이것이 내 문제인지 아십니까? 저는 많은 게시물을 읽었으며 오늘 저에게는 매우 큰 두통이었습니다. 아래는 간단한 예입니다. financeWrap
에는 테이블 정보가 있지만 beautifulSoup는 테이블 정보가 비어 있음을 나타냅니다.
import requests
from bs4 import BeautifulSoup
url = "http://financials.morningstar.com/ratios/r.html?t=AAPL®ion=usa&culture=en-US"
response = requests.get(url)
soup_key_ratios = bs(response.content, 'html5lib')
financial_tables = soup_key_ratios.find("div", {"id":"financeWrap"})
print financial_tables
# Output: <div id="financeWrap">
# </div>
@Begueradj 재미있는 관찰입니다. 나는 당신이 대답을 찾을 수있을 정도로 충분히 열심히 본다면 그것을 정상적으로 발견했습니다! – BryceD
@BryceDoganer 'beautifulsoup'로 질문에 태그를 답니다. 그것은 당신이 신속하게 좋은 대답을받는 데 도움이 될 것입니다. –
아마도 나는 뭔가를 놓치고 있지만'http : // ... en-US'이 문자열로 인용되지 않는 이유가 무엇입니까? – alexwlchan