0

저는 스크립팅에 대한 지식이 없으므로 몇 시간 동안 약 1,500 장의 사진을 웹 사이트에서 다운로드하려고 노력하고 있습니다. 지금까지는 매우 고통 스럽기 때문에 도움이 필요합니다. 콘텐츠를 다운로드하려는 웹 사이트는 플래시 기반 웹 사이트이므로 일반 HTML과 같이 긁적 거리지 않습니다.웹 기반 웹 사이트 스크래핑 방법은 무엇입니까?

"웹 스크레이퍼"라는 Chrome 웹 확장 프로그램을 사용해 보았지만 웹 페이지에서 아무 것도 선택할 수 없었습니다. 플래시는 "바이너리 형식"을 사용하기 때문에이 방법을 사용한다고 가정합니다.

그래서 나는 좋은 o'l 개발자 도구를 체포하기로 결정하고이 내가 찾은 것입니다 :

내가 별도의 탭의 "헤더"에서 요청 URL을 방문 할 때, 내가 할 수있는 이미지를보고 다운로드 할 수는 없지만 1500 시간을 할 수는 없습니다.

근근이 살아가는 것에 대한 연구가 끝난 후 나는이 상황에서 도움이 될 것 같은 wget이라는 프로그램을 발견했습니다. 다운로드 한 다음 요청 URL 중 하나에서 시도했습니다. 그것은 완벽하게 작동하고 이미지를 다운로드했습니다. 그것으로 놀고 난 후에 나는 wget에서 여러 페이지를 한 번에 다운로드 할 수있는 링크를 만들 수 있음을 알았습니다. 그래서 Chrome의 헤더 탭에서 모든 요청 URL을 복사하여 붙여 넣을 수 있다고 생각했습니다. wget, 나는 좋을거야. 그러나 URL을 복사하려면 각 이미지를 개별적으로 클릭해야하는데 영원히 걸릴 것입니다.

"이름"창에서 파일을 선택할 수도없고, 강조 표시된 자료의 목록을 복사하려면 다른 파일을 Shift 키를 누른 채로 클릭 할 수 있습니다. 볼 수 있듯이, 파일 사이에 줄임표 ("...")가 있기 때문에 파일 이름을 줄이기 위해 각 파일의 이름을 사용합니다 (그리고 나는 전체 이름을 보여주기를 희망하면서 "이름"창을 확장하려고 시도했지만 시도하지 않았습니다).

그래서 어떤 종류의 스크립트를 사용하여 동시에 여러 파일을 다운로드 할 수있는 방법이 있습니까? 도움이 될 스크립팅을 배우기 위해 사용할 수있는 리소스는 무엇입니까?

도움이 될 수있는 다른 방법이 있습니까? 여기에 내 시간을 줄여 줄 수있는 모든 것이 인정 될 것입니다. 감사 :).

답변

1

알고 계셨습니까? 해당 dev-tool 네트워크 목록을 마우스 오른쪽 버튼으로 클릭하고 "내용이있는 HAR로 저장"을 선택한 다음 해당 파일에서 데이터를 검색 할 수 있습니다.

또한 내가이 작업을 수행 할 수있는 실현하지만 난 그것을 열 수 없습니다

Save as HAR with content

+0

'모든 HAR로 복사'를 '복사'하위 섹션에서 살펴>이있다. 어떤 종류의 프로그램이 필요합니까? –

+0

어떤 종류의 텍스트 편집기라도 필요한 URL에 대한 파일을 구문 분석하고 모든 종류의 스크립트를 사용하여 URL 목록을 다운로드하십시오. – joopmicroop

+0

har 파일은 json 데이터입니다. – joopmicroop