2014-02-11 5 views
0

BeautifulSoup로 URL의 이름을 어떻게 얻을 수 있습니까?BeautifulSoup로 URL의 이름을 얻는 방법

from BeautifulSoup import BeautifulSoup 
import urllib2 
import re 

html_page = urllib2.urlopen("http://www.youtube.com") 
soup = BeautifulSoup(html_page) 
list = soup.findAll('div', attrs={'class':'profileBox'}) 

for div in list: 
    print div.a['href'] 

--------------------------------- 
<a href="/sam">sam utx</a> 
------------------------------------- 

이 인쇄 href를 ("/ 샘")하지만 필요가 URL의 이름 SAM (UTX)입니다 : 이 코드를했습니다. 어떻게 만들 수 있습니까?

답변

0

이 함께 div 자체 내부의 text를 선택할 수 있습니다

div.a.string 

당신이 here에 대한 자세한 내용을보실 수 있습니다.