다음 표의 HTML 코드를 스크랩했습니다. 테이블의 각 요소와 관련된 링크 만 다뤄야합니다. 어떻게 할 수 있습니까?BeautifulSoup로 스크랩 URL
import urllib2
from bs4 import BeautifulSoup
first=urllib2.urlopen("http://www.admision.unmsm.edu.pe/res20130914/A.html").read()
soup=BeautifulSoup(first)
for tr in soup.find_all('tr')[2:]:
tds = tr.find_all('td')
print tds
결과는 다음과 같이이다 :
여기 내 코드의
[<td><a href="./A/013/0.html">ENFERMERÍA</a></td>]
[<td><a href="./A/0141/0.html">TEC. MED. LAB. CLÍNICO Y ANATOMÍA PATOLÓGICA</a></td>]
[<td><a href="./A/0142/0.html">TEC. MED. TERAPIA FÍSICA Y REHABILITACIÓN</a></td>]
[<td><a href="./A/0143/0.html">TEC. MED. RADIOLOGÍA</a></td>]
결과? 올바르게 복사 했습니까? –
또한, 나는 드물게 beautifulSoup를 사용하지만, 가지고있는 것을 주어서 왜 셀 안에 링크를 얻기 위해'links = td.find_all ('a')'를 사용하지 않는가? –