는 내가 흥미있어 반복적 인 코드를 포함 PHP 파일을 얻었다. 여기 Python에서 beautifulsoup를 사용하여 특정 요소를 긁는 방법?
<a href="/browse.php?cat=298"><img src="/Static/icons/cat_black_mirror.jpeg" alt="Черное зеркало" title="Черное зеркало" align="left" class="category_icon" border="0" /></a>
<span class="torrent_title"><b>Заткнись и танцуй (Shut Up and Dance)</b></span><br />
Дата: <b>01.01.2017 20:51</b><br />Звук: <b>Многоголосый закадровый (LostFilm.TV)</b>
</span>
내가 흥미있어하는 토런트 제목과 링크 예를
입니다. 그러나, 클래스와 스팬에 가려고했습니다. 그리고 링크를 찾으십시오. 여기에 예가 있습니다url = 'http://www.lostfilm.tv/browse.php?'
lost_f = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
lost_soup = BeautifulSoup(lost_f.text,'html.parser',from_encoding="windows-1251")
for item in lost_soup.findAll('span', {'class': 'torrent_title'}):
print item.text
print item.previous_sibling.previous_sibling['href']
다음과 같은 결과가 나타납니다 : 이름 + 잘못된 링크. 어떻게 급류 이름과 관련 링크를 얻을 수 있습니까?
작품 잘. 어떤 링크를 얻습니까? 이 페이지에 문제가있는 것 같습니다. 이미지와 링크는 제목과 다릅니다. –