이미지 및 기타 데이터를 다운로드하는 Python 크롤러

크롤링하려는 사이트에 수천 개의 사용자 페이지가 포함되어 있으며 다른 사이트에서 가져 와서 출력하고 싶습니다. 예를 들어, example.com은 사용자 사진, 이름 및 제목을 나열합니다. 코드는 다음과 비슷하게 각 페이지는 약 50 사용자가 포함이미지 및 기타 데이터를 다운로드하는 Python 크롤러

<a href="/tommy"><img src="userphoto"></a> 
<h1 class="username">Tommy</h1> 
<p class="headline">President</p>

I 크롤링하는 데 필요한 페이지를 얻으려면, 당신은 ID (100)를 통해 example.com?id=1 모든 길을 갈 것 . example.com의 각 100 페이지를 크롤링하고 사용자 사진, 이름 및 제목을 잡고 다른 사이트에서이 콘텐츠를 출력하려면 어떻게해야합니까? 도와주세요!

출처

2014-07-11 Trey Copeland

치료를 사용하십시오. 당신이 원하는 것을하는 것은 매우 간단합니다. –