2014-12-20 7 views
1

저는 python으로 웹 사이트에서 하루에 한 번씩 pdf 파일을 자동으로 다운로드하는 프로그램을 작성하고 있습니다. 테스트를 시도 할 때 다운로드 한 파일의 확장자는 정확했지만 수동으로 다운로드 할 경우 보통 크기 인 약 100kB에 비해 매우 작습니다 (< 1kB).웹 사이트에서 프로그램 다운로드를 자동으로 중지 할 수 있습니까?

웹 사이트에서 프로그램이 자동으로 파일을 다운로드하지 못하도록 차단할 수 있습니까?

수행 할 수있는 조치가 있습니까?

답변

3

예. Cloudflare는 봇의 파일 다운로드를 차단할 수 있습니다. 차단은 일반적으로 사용자 에이전트를 감지하거나 웹 페이지에서 자바 스크립트를 포함하여 수행됩니다. 메모장에서 pdf 파일을 검사하고 포함 된 내용을보고 파이썬 코드에 user-agent 옵션을 추가해보십시오.

관련 문제