내가 URL을 얻을 컬과 wget을 모두 사용하고 있습니다 : 컬를 들어 http://opinionator.blogs.nytimes.com/2012/01/19/118675/왜곡되지는 않지만 wget이 작동합니까?
, 그것은 전혀 출력을 반환하지만 wget과 함께, 그것은 전체 HTML 소스를 반환 : 여기
는이 명령됩니다. 나는 동일한 사용자 에이전트를 사용했으며, 둘 다 동일한 IP에서오고 있으며 리디렉션을 따르고 있습니다. URL은 정확히 동일합니다. 컬의 경우 1 초 후에 즉시 반환되므로 시간 초과 문제가 아닙니다.
curl -L -s "http://opinionator.blogs.nytimes.com/2012/01/19/118675/" --max-redirs 10000 --location --connect-timeout 20 -m 20 -A "Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" 2>&1
wget http://opinionator.blogs.nytimes.com/2012/01/19/118675/ --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
NY Times가 클로킹을하고 소스를 말릴 수없는 경우 컬이 다른 머리글을 보낼 수 있습니까? 나는 사용자 에이전트가 같기 때문에 요청은이 두 요청 모두에서 똑같이 보일 것이라고 가정했다. 다른 "발자국"을 확인해야합니까?
이 하나가 도움이 될까요? http://stackoverflow.com/questions/8298727/curl-hanging-for-15-seconds-when-sending-head-requests –
전혀 도움이 안된다. ( –
curl 요청에'-v' 플래그를 추가하는 것이 좋습니다. wget 요청에 추가 된'-d' 플래그는 성공적인 wget 요청으로 어떤 일이 일어나는지 보여줍니다. 두 프로그램 모두 로그인 페이지로 리다이렉션되지만, 어떻게 든 wget이 성공적으로 대상 자원을 검색하지만 curl은 나쁜 리다이렉션을 얻고 포기할 때까지 지속적으로 리다이렉트된다. wget이 nytimes.com으로 쿠키를 보내고있는 것처럼 보일 것이다. curl은 쿠키를 보내지 않는다. –