웹 사이트에서 여러 단어 문서를 반복 할 수있는 폴더에 다운로드하려고합니다. 그들은 셰어 포인트 목록에 호스팅되어 있으며, 이미 HTML 코드를 파싱하여 이러한 단어 문서에 대한 모든 링크 목록을 컴파일 할 수있었습니다. 이 링크를 클릭하면 단어 문서를 열거 나 저장하라는 메시지가 나타납니다. 이 연결의 끝에서, doc라는 단어의 제목도 거기에 있습니다. URL 문자열을 분할하여 내 URL 목록과 일치하는 단어 문서의 이름 목록을 가져올 수있었습니다. 내 목표는 모든 URL을 통과하고 모든 단어 문서를 폴더로 다운로드하는 루프를 작성하는 것입니다. 편집 - 내 코드 - ... 고려 @DeepSpace 고려하고 @aneroid의 제안을 (그리고이를 구현하기 위해 최선을 다하고)URL에서 워드 문서를 파이썬의 지정된 디렉토리에있는 폴더로 다운로드하는 방법은 무엇입니까?
import requests
from requests_ntlm import HttpNtlmAuth
import shutil
def download_word_docs(doc_url, doc_name):
r = requests.get(doc_url, auth=HttpNtlmAuth(domain\\user, pass), stream=True)
with open(doc_name, 'wb') as f:
shutil.copyfileobj(r.raw, f) #where's it copying the fileobj to?
는 내 요청이 다운로드에 있기 때문에이 이미지와 다른 생각 링크가 아닌 물리적 인 jpeg 이미지 ... 나는 틀릴 수도 있지만 이것은 까다로운 상황입니다.
내 프로그램이 .docx를 지정된 경로 (설정할 수있는 폴더)에 다운로드 (또는 복사본 만들기)하려고하는 중입니다. 현재 그것은 admin 명령 프롬프트 (나는 Windows에있어)에서 오류없이 실행되지만 파일을 복사하는 위치를 알지 못합니다. 내 희망은 내가 하나를 얻을 수있는 경우 URL 목록에 반복하는 방법을 알아낼 수 있습니다. 지금까지 도움을 주신 분들 (@DeepSpace 및 @aneroid). 코드에서
기본적으로 가능하면
그렇지 않은 경우는, 파일 이름과 URL의 끝을 사용 파이썬은 작업 디렉토리와 같은 폴더를 프로그램에서 사용할 것이므로 파일을 넣을 것을 기대합니다. 그러나'download_word_docs'가 전혀 호출되지 않을 가능성이 있습니까? 'print ("download_word_docs는")'문을 추가하면 실제로 출력됩니까? –