2012-07-31 2 views
0

this 웹 사이트를 방문했을 때 Firefox 13을 통해 일부 컨텐츠가있는 페이지가 있습니다. 그러나 wget을 사용하여 다운로드 할 때 :wget이 적절한 페이지를 반환하지 않습니다.

wget http://tinhvan.com 

다운로드 한 HTML 페이지에 다른 콘텐츠가 있습니다. 설정 한 사용자 에이전트를 시도 :

wget -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

동일한 결과가 나타납니다.

무슨 일이 일어 났습니까? Firefox를 방문했을 때와 동일한 결과를 얻으려면 어떻게해야합니까?

UPDATE

다음은 파이어 폭스 => 소스보기에서이다 :

<!DOCTYPE html> 

<html dir="ltr" lang="vi"> 

    <head id="ctl00_page_header"> 




      <title> 

       Tinhvan Group - Trang chủ  

여기 wget을

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><link href="Content/images/main.css" rel="stylesheet" type="text/css" /><link href="Content/images/mail-detail.css" rel="stylesheet" type="text/css" /> 
    <script src="../../Content/JqueryUI/js/jquery-1.3.2.min.js" type="text/javascript"></script>  
    <title> 

    Trang chủ - Tinhvan Group Website 
+1

'wget이 무엇을 반환하는지 보여줄 것입니다. – CharlesB

+0

나는 같은 결과를 얻었습니다. –

+0

@CharlesB : 질문을 업데이트했습니다 – HVNSweeting

답변

1

파이어 폭스 (단지 FF, 크롬, IE에 의해 다운로드에서, etc) 자동으로 Accept * 헤더를 추가합니다.

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Encoding: gzip, deflate 
Accept-Language: en-US, en;q=0.5 

wget --header="Accept: text/html" -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

참고하십시오 : 당신이 Accept 헤더를 선언하지 않는 경우 자동으로 wget 용 수락 추가 : */* 나에게 당신은 아무것도주지 의미한다. 이 사이트는 기본적으로 aplication/xhtml + xml을 반환하지만 text/html을 기대합니다.

관련 문제