1
나는 파이썬과 기계화를 통해 아마존 판매자 센트럴에 액세스하려고합니다.스크래핑 아마존 판매자 센트럴
이것은 내 코드라고 생각합니다. 로그인 만 할 수있는 페이지를 선택하면 다음 페이지로 리디렉션됩니다. "Amazon을 계속 사용하려면 브라우저에서 쿠키를 활성화하십시오. 쿠키가 활성화되면 아래의 버튼을 클릭하여 이전 페이지로 돌아가십시오. "
파이썬에서 쿠키를 활성화하거나 기계화 설정을 어떻게 할 수 있습니까?
import mechanize
import urllib2
import cookielib
import requests
browser = mechanize.Browser()
browser.set_handle_robots(False) # ignore robots
browser.set_handle_refresh(False) # can sometimes hang without this
cj = cookielib.CookieJar()
browser.set_cookiejar(cj)
USERNAME = 'MyUsername'
PASSWORD = 'MyPass'
response = browser.open("https://sellercentral.amazon.fr/gp/homepage.html")
browser.select_form("signinWidget")
browser.form['username'] = USERNAME
browser.form['password'] = PASSWORD
responsecheck = browser.submit()
print responsecheck.read()
check = browser.open("https://sellercentral.amazon.fr/gp/global-selling/gateway-widget-crosslisting-potential/crosslisting-potential-widget-internals.html?_=1411311676093")
print check.read()
는 조금 늦게 수 있습니다, 사전에
토마스
가능한 복제본 [세션 쿠키를 먼저 제공해야하는 웹 페이지를 긁습니다] (http://stackoverflow.com/questions/9754807/scrape-web-page-that-requires-they-give- 너 - 세션 - 쿠키 - 먼저) – user1767754
나는 일반적으로 그냥 세션을 사용하지만 그것은 인증 쿠키를 잘 저장합니다. 그 부분을 살펴보고 실제로 필요한 기계화 기능이 얼마나 더 많은지에 따라 스크래핑 비트에 대해 BeautifulSoup을 사용하기를 원할 수도 있습니다. – BWStearns