2010-11-20 7 views

답변

1

내가 파이썬에서 그것을 할 것입니다 방법은 다음과 같습니다

  • 당신이에서 이미지를 잡아해야하는 각 페이지를 가져 오지 잡아
  • 구문 분석 각각의 HTML 파일 (쉽고, 단지 mechanize 또는 다른 HTTP 가져 오기 라이브러리를 사용) 이미지 URL 이것은 조금 더 복잡합니다 - HTMLParser을보십시오. 메모리에서 하위 클래스 HTMLParser을 사용하면 관심있는 텍스트 만 가져올 수 있습니다.이 경우 HTML img 태그의 src 속성입니다 (예 : <img src="this is what you want" width=640 height=480/>
  • 같은 위 (쉬운) 얻은 각 이미지

는 개인적으로하지만, 나는이 파이썬을 사용하지 것이다을 가져옵니다. 위의 방법의 첫 번째 단계와 마지막 단계는 wget으로 쉽게 수행 할 수 있습니다. 두 번째 작업은 grep으로 수행 할 수 있으며 bash을 사용하면 모든 작업을 하나로 묶을 수 있습니다. 사실, 이것은 내가 정확히 무엇을 추천했는지 here입니다.

물론 Linux를 사용하는 경우입니다. bash가 없으면 Python을 얻는 것이 차선책 일 것입니다.