2014-12-25 11 views
0

파이썬에서 요청 라이브러리를 사용하여 자동으로 다른 웹 사이트로 리디렉션되는 웹 사이트의 HTML을 가져 오려고합니다. 가능하면이 방법을 피하고 원래 사이트의 HTML을 가져 오는 방법은 무엇입니까? Chrome보기 - 소스 기능을 통해 액세스 했으므로 HTML이 있음을 알고 있습니다. 어떤 도움을 주셔서 감사합니다.웹 사이트에서 302 HTTP 응답 코드를 제공하는 경우 원본 링크의 원시 HTML을 여전히 사용할 수 있습니까?

답변

1

기본적으로 그렇지 않습니다. 웹 서버가 302를 반환하면 오래된 html (매우 이상하게 보일 것입니다)을 포함하기로 결정하지 않으면 기본적으로 운이 없습니다.

이제 웹 브라우저를 사용하여 리디렉션하지 않으면 사용자 에이전트 스니핑과 리디렉션과 같은 작업을 수행하고있는 것입니다. 따라서이 경우에는 코드가 필요하다고 주장해야합니다.

1

나는 이것이 오래되었음을 알고 있지만, 사이드 바에서 그것을 보았고 나는 미래의 독자들에게 대답 할 것이라고 생각했다.

요청을 사용하는 동안 allow_redirectsFalse으로 설정하면 처음 302시에 중지되어 소스 코드를 가져올 수 있습니다.

그래서, r = requests.get(url, allow_redirects=False)

Source

관련 문제