는이 코드가 있습니다어떻게 모든 소프트웨어 링크를 얻을 수 있습니까?
import urllib
import urlparse
from bs4 import BeautifulSoup
url = "http://www.downloadcrew.com/?act=search&cat=51"
pageHtml = urllib.urlopen(url)
soup = BeautifulSoup(pageHtml)
for a in soup.select("div.productListingTitle a[href]"):
try:
print (a["href"]).encode("utf-8","replace")
except:
print "no link"
pass
을하지만 그것을 실행할 때, 나는 20 개 링크 만 얻을. 출력은 20 개가 넘는 링크 여야합니다.
왜 20 개가 넘는 링크입니까? 페이지 당 20 개의 링크 만 있습니다. – Blorgbeard
@Blorgbeard 하단에는 여전히 많은 페이지가 있기 때문에. –
첫 페이지 만 다운로드했습니다. 그들 모두를 반복해야합니다. – Blorgbeard