자동화 JPEG 다운로드

내가 페이지에서 JPEG 크기의 이미지> MIN_SIZE를 다운로드해야

1 < = PAGE_NUMBER < = NUM_OF_PAGES 내가 파이썬에서 그렇게 할 수있는 방법자동화 JPEG 다운로드

http://somewebsite.com/showthread.php?t=12345&page=PAGE_NUMBER

? 나는 Python을 처음 사용한다. 여기

출처

2010-11-20 devnull

심각하게? .... – aaronasterling

내가 파이썬에서 그것을 할 것입니다 방법은 다음과 같습니다

당신이에서 이미지를 잡아해야하는 각 페이지를 가져 오지 잡아
구문 분석 각각의 HTML 파일 (쉽고, 단지 mechanize 또는 다른 HTTP 가져 오기 라이브러리를 사용) 이미지 URL 이것은 조금 더 복잡합니다 - HTMLParser을보십시오. 메모리에서 하위 클래스 HTMLParser을 사용하면 관심있는 텍스트 만 가져올 수 있습니다.이 경우 HTML img 태그의 src 속성입니다 (예 : <img src="this is what you want" width=640 height=480/>
같은 위 (쉬운) 얻은 각 이미지

는 개인적으로하지만, 나는이 파이썬을 사용하지 것이다을 가져옵니다. 위의 방법의 첫 번째 단계와 마지막 단계는 wget으로 쉽게 수행 할 수 있습니다. 두 번째 작업은 grep으로 수행 할 수 있으며 bash을 사용하면 모든 작업을 하나로 묶을 수 있습니다. 사실, 이것은 내가 정확히 무엇을 추천했는지 here입니다.

물론 Linux를 사용하는 경우입니다. bash가 없으면 Python을 얻는 것이 차선책 일 것입니다.

출처

2010-11-20 11:53:14 misha

자동화 JPEG 다운로드

답변

관련 문제