2014-06-09 2 views
0

파이썬을 사용하여 웹 사이트의 테이블에서 데이터를 긁어 내려고했습니다.테이블 파이썬에서 데이터 스크랩

from bs4 import BeautifulSoup 
from mechanize import Browser 

BASE_URL = "http://www.ggp.com/properties/mall-directory" 

def main(): 
    mech = Browser() 
    url = "http://www.ggp.com/properties/mall-directory" 
    page1 = mech.open(url) 
    html1 = page1.read() 
    soup1 = BeautifulSoup(html1) 
    extract(soup1, 2007) 


def extract(soup,year): 
    table = soup.find("table") 
    for row in table.findAll('option'): 
     print row 


main() 

행 인쇄 아웃 :

<option value="184">Yakima, WA</option> 
<option value="896">Yankton, SD</option> 
<option value="851">Yazoo City, MS</option> 
<option value="113">York-Hanover, PA</option> 
<option value="87">Youngstown-Warren, OH-PA</option> 
<option value="235">Yuba City, CA</option> 
<option value="205">Yuma, AZ</option> 
<option value="424">Zanesville, OH</option> 

하지만 내가 원하는 것은 내가 row.findAll('option value') 시도했지만 문제가 해결되지 않는

Yakima, WA 
Yankton, SD 
Yazoo City, MS 
York-Hanover, PA 
etc... 

입니다 ... 내가 생각

+0

https://gist.github.com/cobralibre/120191 –

+0

'print row.get_text()'를 사용하십시오. – Vipul

답변

1

이게 작동해야합니다

print row.getText()