특정 검색 항목을 가져 와서 결과에 관련된 .CSV 파일 전체를 저장하는 크롤러를 작성하려고합니다.Python 사이트 크롤러, Scrapy로 파일 저장
나는 이미 필요한 모든 HTML 데이터를 구문 분석하는 스파이더를 가지고 있으며, 지금 내가해야 할 일은 필요한 파일을 어떻게 저장할 수 있는지를 파악하는 것입니다.
그래서 검색은 다음 웹 브라우저에 상관 .csv 파일을 저장하라는 메시지를 표시이 https://www.thissite.com/data/file_download.jsp?filetype=1&id=22944대한 링크를 반환합니다. 이 페이지를로드하고 파일을 다운로드 할 수 있도록 스파이더를 작성하려면 어떻게해야합니까? 아니면 정보에 대한 정적 링크를 잡을 수있는 방법이 있습니까?
URL이 무엇을 반환하는지 확인하십시오. 아마도 리디렉션 일 것입니다. – tripleee
리디렉션이 아닙니다. – howdoicrawlweb