2016-10-26 2 views
0

저는 BeautifulSoup 멍청한 녀석이고 웹 사이트 flashscores.co.uk에서 약간의 운을 따라 점수를 추출하려고합니다!BeautifulSoup4를 사용하여 웹 사이트에서 테이블 정보 추출하기


다음
import urllib2 
from bs4 import BeautifulSoup 

flash = "http://www.flashscore.com/soccer/england/premier-league/results/" 

prem = urllib2.urlopen(flash) 

soup = BeautifulSoup(prem, "html.parser") 

table = soup.find('table', {'class': 'soccer'}) 

for row in table.FindAll("span") 

print (row.text) 

내가로부터 정보를 추출하기 위해 노력하고있어 페이지 소스의 이미지입니다 :

이 지금까지 내 코드입니다. 좋은 출발점 표시 할 것 : 첼시 4 맨체스터 유나이티드 0

Page Source

어떤 도움/제안 크게 감상 할 수있다!

답변

0

테이블 정보가 들어있는 HTML은 실제로 JavaScript에 의해 생성됩니다. urllib2는 자바 스크립트를 처리하지 않습니다.

브라우저가 JavaScript을 처리 한 후 실제로 "페이지 소스"로 연결된 것은 입니다. javascript가 비활성화 된 상태에서 페이지를로드하면 결과가로드되지 않습니다.

대신 JavaScript를 처리하는 selenium과 같은 것을 사용해야합니다.

+0

고마워요! 셀레늄을 시험해 볼게. – Sagg

관련 문제