2016-10-22 2 views
1

나는 내 FT.com 계정에 로그인하고 나를 위해 일부 데이터를 가져올 스크립트를 작성하려고합니다.파이썬의 요청으로 FT.com에 로그인

첫 번째 장애물은 분명히 로그인하고 있습니다. 저는 Pythons Requests 라이브러리를 사용하고 있습니다.

#!/usr/bin/env python 
import requests 


# log into FT website 
log_in_url = 'https://accounts.ft.com/login' 
my_email = '[email protected]' 
my_pass = 'mypassword' 
data = {'email': my_email, 
     'password': my_pass, 
} 

with requests.Session() as session: 
    log_in_request = session.post(log_in_url, data=data) 
    # prints log-in page with error about contacting cus. service 
    print log_in_request.content 

그냥 다시 로그인 페이지로 저를 리디렉션

여기 내 코드입니다. 그것은 '잘못된 세부 사항'이나 아무것도 말하지 않습니다 (그들은 분명히 정확합니다). 나에게 로그인을 허용하지 않습니다. POST 요청에 문제가있는 것 같습니다. 헤더 나 쿠키 등이 누락 된 것 같습니다.

아무도 모르게 무슨 일이 일어날 지 알고 있습니까?

건배,

+0

을, 그림 요청이있는 곳을 찾은 다음 요청을 통해 그것을 재현 해 봅니다. – agg3l

+0

Session 객체로 페이지를 먼저 가져옵니다. –

+0

이것들과 백만 가지 다른 것들을 모두 시도했습니다. 이 사이트에서는 아무 것도 작동하지 않는 것 같습니다. –

답변

2

당신이 원본 콘텐츠를 복사하거나 무시할 수없는 긁어 양의 데이터를 피트 웹 사이트에서 당신이 그들의 T & 고사를 위반 될 것입니다, 당신은 바로 차단 될 경우를 (하지에 저작권법 언급).

FT는 부분적으로 광고 자금입니다. 파이썬을 사용하여 이것을 우회하면 합법적 인 수익원을 침식합니다.

필자는이 스크립트를 사용하여 복사/붙여 넣기를 사용하여 이전에 작성한 워치리스트를 Excel로 가져 왔습니다. 저는 분석이나 기사 읽기에는 사용하지 않습니다. 나는 브라우저를 통해 FT를 읽고 매일 상당한 수준의 광고 시청 트래픽을 발생 시켰습니다.

남용하지 마십시오. 그렇게하면 모든 유료 가입자가 Python에서 조그마한 탐색을 할 수 없도록 차단 될 수 있습니다. 당신이 그렇게에 데이터 마이닝 및 수행하고자하는 경우 FT 개발자 프로그램이 있습니다

from robobrowser import RoboBrowser 

browser = RoboBrowser(history=True) 

url='https://accounts.ft.com/login?location=https%3A%2F%2Fwww.ft.com%2F' 

browser.open(url) 
form=browser.get_form() 
form['email']="" 
form['password']="" 
browser.session.headers['Referer'] = url 
browser.submit_form(form) 

: 나는 당신이 로그인시 전송되는 헤더/데이터, 브라우저 웹 개발자 도구를 열고 확인하는 것이 좋습니다 https://developer.ft.com/

+0

답장을 보내 주셔서 감사합니다. 나는 저작권법을 위반하거나이 스크립트를 전혀 공유하지 않을 의도가 없습니다. 저의 의도는 단순히 일간 신문을 PDF (FT가 버튼으로 제공함)로 다운로드하고 준비가되면 이메일로 알려주는 것입니다. 나는 이것을 발사하고 그것이 효과가 있는지 볼 것이다. –

+0

합리적인 것 같습니다. 나를 위로하고 해결할 수 있습니까? 내 priveleges 순간 stackoverflow에 쓰레기는 ... – langbourne

+0

(그것은 물론 당신을 위해 일한다고 가정!) – langbourne