파이썬에서 트위터 로그인이 필요한 웹 사이트의 스크랩

최근 트위터 로그인이 필요한 사이트에서 일부 파이썬 웹 스크래핑을 수행해야했습니다. 내가 예상했던대로 아주 똑바로 아니었고 많은 문제가 발생했습니다.파이썬에서 트위터 로그인이 필요한 웹 사이트의 스크랩

데이터를 스크랩하려고합니다. https://www.scoutzen.com/twitter-lists/search?page=1&q=luxury 그리고 트위터에 연결되어있을 때만 결과에 액세스 할 수 있습니다. 그래서 나는 파이썬으로 트위터에 로그인 한 다음 원하는 웹 사이트에 요청을 보내려고했다. 내 코드 이하 는 :

session_requests = requests.session() 
result = session_requests.get("https://twitter.com/login") 


authenticity_token= 
list(set(tree.xpath("//input[@name='authenticity_token']/@value")))[0] 


payload = { 
    'action': 'login', 
'session[username_or_email]': '[email protected]', 
'session[password]': 'pass', 
'authenticity_token': authenticity_token 
} 

result = session_requests.post("https://twitter.com/login", data = payload, 
headers = dict(referer = "https://twitter.com/login")) 

# Scrape url 
result = session_requests.get("https://www.scoutzen.com/twitter-lists/search? 
q=luxury", headers = dict(referer = "https://www.scoutzen.com/twitter- 
lists/search?q=luxury")) 

print(result.text)

나는 트위터에서 로그가 성공을 수행되었음을 확인,하지만 난 웹 사이트 www.scoutzen.com 여전히 로그인이 필요한 것을 깨달았다.

쿠키와 관련이있을 수 있습니까? 다른 패키지를 사용해도 로그인해야합니까?

아무쪼록 부탁드립니다. 많은 감사

출처

2017-11-30 mohamed dhaoui