현재 우분투 서버에 스크립트를 배포하고 제품에 대한 링크를 고치고 있습니다. 이 사이트에서는 User-Agent 및 URL 헤더 관련 항목을 지정해야합니다. 내가 우분투를 사용하고 우분투에 프록시 서버에 연결하고 때, 내 "HDR"변수는이 스크립트에서 무엇을해야 :우분투의 헤더, 사용자 - 에이전트, URL 요청
는import urllib2
from bs4 import BeautifulSoup
import requests
from lxml import etree
import smtplib
import urllib2, sys
url = "http://www.sneakersnstuff.com/en/product/22422/adidas-superstar-80s"
hdr = {'User-Agent': 'Mozilla/5.0'}
req = urllib2.Request(url,headers=hdr)
page = urllib2.urlopen(req)
이 스크립트는하지만 확실하지 내가 뭘 것, 내 컴퓨터의 전원을 오는에 잘 작동합니다 우분투 용 브라우저 또는 사용자 에이전트로 지정하십시오.
코드 :
import urllib2
from bs4 import BeautifulSoup
import requests
from lxml import etree
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
import urllib2, sys
url = "http://www.sneakersnstuff.com/en/product/22422/adidas-superstar-80s"
hdr = {'User-Agent': 'Mozilla/5.0'}
req = urllib2.Request(url,headers=hdr)
page = urllib2.urlopen(req)
soup = BeautifulSoup(page, "lxml")
result = soup.find_all("span", {"class":"availability"})
는 오류 코드를 반환 urllib2.HTTPError : HTTP 오류 403 : 금지하지만이뿐만 아니라 당신이없는 로컬 컴퓨터
한'파이썬 URLLIB/2.1'' – greybeard