2012-06-08 2 views
0

파이썬을 사용하여 두 번의 별도 호출을하지 않고 html과 http 헤더 정보를 모두 검색 할 수있는 단일 HTTP 요청을 만들 가능성을 조사하고 있습니다.파이썬을 사용하여 단일 요청에서 html과 헤더 가져 오기

누구든지 좋은 방법을 알고 있습니까?

또한 이러한 요청을 작성하는 여러 가지 방법 간의 성능 차이는 무엇입니까? 예 : urllib2 및 http 연결 등

답변

3

그냥 urllib2.urlopen()을 사용하십시오. 반환 된 개체의 read() 메서드를 호출하여 HTML을 검색 할 수 있으며 머리글은 headers 특성에서 사용할 수 있습니다.

import urllib2 
f = urllib2.urlopen('http://www.google.com') 

>>> print f.headers 
Date: Fri, 08 Jun 2012 12:57:25 GMT 
Expires: -1 
Cache-Control: private, max-age=0 
Content-Type: text/html; charset=ISO-8859-1 
Server: gws 
X-XSS-Protection: 1; mode=block 
X-Frame-Options: SAMEORIGIN 
Connection: close 

>>> print f.read() 
<!doctype html><html itemscope itemtype="http://schema.org/WebPage"><head><meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> 
... etc ... 
1

HTTPResponse을 사용하는 경우 두 가지 함수 호출로 헤더와 내용을 사용할 수 있지만 서버로 두 번 이동하지는 않습니다.

관련 문제