BASH 내부에서 프로그램 cURL을 사용하여 웹 페이지의 소스 코드를 다운로드하려고했습니다. 페이지가 단순 HTML보다 복잡한 인코딩을 사용할 때 페이지의 코드를 다운로드 할 때 어려움을 겪고 있습니다. 예를 들어, 나는 다음과 같은 명령을 사용하여 다음 페이지의 소스 코드를 볼하려고 :cURL - 웹 사이트 소스 검색
curl "http://shop.sprint.com/NASApp/onlinestore/en/Action/DisplayPhones?INTNAV=ATG:HE:Phones"
그러나 파이어 폭스에 의해 생성 된 소스 코드와 일치하지 않는이 결과 나는 "소스보기"를 클릭합니다. 나는 그것이 페이지에 자바 스크립트 요소가 있기 때문에 그것이라고 믿는다. 그러나 나는 확신 할 수 없다.
예를 들어, 나는 할 수 없습니다
curl "http://shop.sprint.com/NASApp/onlinestore/en/Action/DisplayPhones?INTNAV=ATG:HE:Phones" | grep "Access to 4G speeds"
그 구절은 분명히 파이어 폭스 소스에서 발견된다하더라도. 맨 페이지를 살펴 보았지만 가능한 해결책을 찾기 위해 문제에 대해 충분히 알지 못합니다.
좋은 대답은 이것이 내가 기대하는 방식으로 작동하지 않는 이유와 컬 또는 Linux 상자에서 실행 가능한 다른 도구를 사용하여 문제에 대한 해결책을 포함합니다.
편집 : 나는 또한없는 성공을 가진 사용자 에이전트 스위치를 포함했다 아래 제안시
:
이curl "http://shop.sprint.com/NASApp/onlinestore/en/Action/DisplayPhones?INTNAV=ATG:HE:Phones" -A "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.2.3) Gecko/20100423 Ubuntu/10.04 (lucid) Firefox/3.6.3" | grep -i "Sorry"
마우스 오른쪽 - 더보기 \t HTC EVO ™ 4G * * 듀얼 모드 3G/4G 장치, 신뢰할 수있는 3G – Ryan
감사에 액세스 3G보다 최대 10 배 더 빨리 4G 속도에 액세스하십시오 톤!! 내 마지막 질문은이 쿠키가 일정 기간 동안이 스크립트를 실행할 수있을 정도로 오래 지속되는지 여부입니다. 아니면이 쿠키를 다시 다운로드해야합니까? – Ryan