2012-04-02 8 views
1

나는 웹 사이트에서 링크를 가져옵니다 python 스크립트를 작성하고 있습니다. 그러나 이것으로 시도했을 때 web page 링크를 얻을 수 없었습니다. 내 스크립트입니다 :파이썬 웹 페이지에서 링크를 얻을 수 없습니다

soup = BeautifulSoup(urllib2.urlopen(url)) 

datas = soup.findAll('div', attrs={'class':'tsrImg'}) 
for data in datas: 
    link = data.find('a') 
    print str(link.href) 

에만 없음을 인쇄하지 그렇게 왜, 누구든지 설명 할 수 ???

답변

5

변경 :

str(link.href) 

으로 :

from BeautifulSoup import BeautifulSoup 
import urllib2 

url = 'http://www.meinpaket.de/de/shopsList.html?page=1' 
soup = BeautifulSoup(urllib2.urlopen(url)) 
datas = soup.findAll('div', {'class':'tsrImg'}) 
for data in datas: 
    link = data.find('a') 
    print link.get('href') 

출력 :

/de/~-office-partner-gmbh-;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~-24selling-de;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~abalisi-kuenstlerbedarf-shop;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~abcmeineverpackung-de-kg;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~ability;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~ac-foto-handels-gmbh;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~ac-sat-corner-inh-dirk-hahn;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~adamo-fashion-gmbh-shop;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~adapter-markt;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 
/de/~adko;jsessionid=11957F27FC2D888A34532D9848C922FB.as03 

link.get('href') 

그것은 다음과 같이 표시됩니다

관련 문제