이 웹 사이트의 모든 사진을 얻으려면 스크립트를 사용하고 싶습니다. 크롬 개발자 도구를 사용하여 메인 페이지의 소스 코드를 보았습니다. 이 이미지 URL은이 웹 사이트에서 모든 사진을 다운로드하는 방법 : huaban.com
src="http://img.hb.aicdn.com/3e32a8b101e515b9e7dbe8f5a2e47afff5ec6bcf4e4a-OTvsuu_fw192
처럼하지만 난이 페이지를 다운로드하거나하는 wget
또는 curl
을 사용하는 경우 브라우저에서 해당 HTML 파일에 이러한 링크가 없다 "포장 저장"을 선택합니다. 모든 링크를 얻는 방법을 모르겠습니다. 또 다른 문제는 페이지를 아래로 스크롤하면 이미지가 연속적으로 나옵니다. 전체 페이지를 가져올 방법이 있는지 모르겠습니다.
"해당 HTML 파일에는 이러한 링크가 없습니다." 정확히 무엇을 의미합니까? –
wget에서 반환 된 html에 링크가 없는데도 스크롤 할 때 나타나는 것처럼 계속 표시됩니다. 자바 스크립트를 사용하여 동적으로로드 된 것입니다. 따라서 HTML을 파싱하거나 브라우저에서 '생성 된'소스를 복사하기 전에 javascript를 실행할 수있는 라이브러리가 필요합니다. –
은 다운로드 한 HTML에 img URL이 없음을 의미합니다. – JeromeCui