2011-08-09 4 views
0

HttpClient를 사용하여 웹 페이지를 읽으려고합니다. 하지만 HTML 중 일부는 일부 js 마법에 의해 숨겨져,이 페이지에서보기 원본을 때려보십시오. http://uc.worldoftanks.eu/uc/accounts/#wot&at_search=a HttpClient가 "전체"html 페이지를 반환하는 방법을 아는가?html src hidden

답변

5

HttpClient은 자바 스크립트를 처리하지 않으므로 서버에서 http 콘텐츠를 읽을 때 숨길 수있는 콘텐츠가 없습니다.

그것은 아마도 다른 방법으로 라운드 페이지에서 실행되는 자바 스크립트 가능성이 새로운 HTML 요소를 생성하고 HttpClient을 사용하여 처리 할 수있는 것이 아닙니다 DOM을 ...로 추가 있어요는 HttpClient 설계 통신 클라이언트입니다 순전히 HTTP 연결을 통해 데이터를 읽습니다.

+0

옳다. 너무 나쁘다. ( –

+0

@ 마틴 : 내가 말할 수있는 한, 페이지로드 후에 추가되는 유일한 데이터는 다른 주소를 쿼리하여 여전히 쉽게 얻을 수있는 테이블 데이터이며, 내 게시물을 참조하십시오. . –

0

는 페이지가로드가 요청이
http://uc.worldoftanks.eu/uc/accounts/?type=table&offset=0&limit=25&order_by=name&search=a&echo=1&id=accounts_index

로 전송 될 때 테이블 데이터를 확인하려면 HttpClient를 함께 그 주소를 타격보십시오. offset, limitorder_by 값을 사용하여 페이지 매김 및 정렬을 변경하십시오.

수동으로 해당 URL로 이동하면 리디렉션이 발생하므로 HttpClient에 포함해야하는 요청 헤더가있는 것으로 보입니다. 다음과 같이 테이블 데이터와 JSON 응답을 얻을 않는 브라우저 문제 요청,의 전체 헤더는 다음과 같습니다

GET /uc/accounts/?type=table&offset=0&limit=25&order_by=name&search=&echo=1&id=accounts_index HTTP/1.1 
Host: uc.worldoftanks.eu 
Connection: keep-alive 
Referer: http://uc.worldoftanks.eu/uc/accounts/?type=table&offset=0&limit=25&order_by=name&search=a&echo=1&id=accounts_index 
X-Requested-With: XMLHttpRequest 
X-CSRFToken: 5e33bf57602f76de9285e9b14bcfe7fe 
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/13.0.782.107 Safari/535.1 
Accept: application/json, text/javascript, */*; q=0.01 
Accept-Encoding: gzip,deflate,sdch 
Accept-Language: en-GB,en;q=0.8,en-US;q=0.6,ar;q=0.4 
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3 
Cookie: csw_popup=true; __utma=21812543.1316104722.1312873581.1312873581.1312873581.1; __utmb=21812543.2.10.1312873581; __utmc=21812543; __utmz=21812543.1312873581.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); csrftoken=5e33bf57602f76de9285e9b14bcfe7fe 

그들은 예를 들어, X-Requested-With 또는 Accept 또는 Referrer을 찾고 될 수 있습니다.

관련 문제