2017-12-06 1 views
0

페이지에서 표를 긁고 있습니다.긁힌 테이블 : 캡션 블라인드

그러나 표의 캡션은 '시각 장애'입니다.

사이트에서 표를 추출 할 방법이 없습니까? 같은 BeautifulSoup로 사용

:

from urllib.request import urllib 
from bs4 import BeautifulSoup 
+0

우리가 페이지로 연결하고 정확하게 당신이 필요로하는 일 지정 제공합니다. –

+0

'http : //company/c1010001.aspx? cmp_cd = 056190' –

+0

내가 원하는 테이블이 ("div", { "id": "cF1001"}) 임베디드 사이트에 urlopen 모듈을 사용할 것입니다. with ("table", { "class": "gHead01 all-width"}). 감사합니다 .. –

답변

0

이것 좀 봐 :

import bs4 as bs 
import urllib.request 

link = 'http://companyinfo.stock.naver.com/v1/company/c1010001.aspx?cn=&cmp_cd=005930&menuType=block' 
source = urllib.request.urlopen(link) 

soup = bs.BeautifulSoup(source, 'html.parser') 

table = soup.find('table', attrs={'id' : 'cTB24'}) 

for tr in table.find_all('tr'): 
    for td in tr.find_all('td'): 
     print(td.text)