2017-03-22 2 views
0

파이썬 요청 모듈 (get 함수)을 사용하여 크롤러와 같은 링크를 고칩니다. 스크립트를 사용하여 여러 요청을합니다. 너무 많은 요청을했기 때문에 Google은 CAPTCHA를 개입했으며 언젠가 재설정되었습니다. 나는 그것을 피하기 위해 각 요청 후 잠시 동안 코드를 넣으려면 시간 모듈을 사용하고 있습니다. 스크립트가 잠자기 상태가되어 Google이 잘못된 트래픽으로 인식하지 못하도록하는 것이 적절한 지 알고 싶습니다. (나는 대학 프록시 서버를 사용하고 있습니다)Python에서 요청 간 간격은?

+1

Google은 비정상적인 트래픽을 결정하기 위해 여러 매개 변수를 사용합니다. 그들은 분명히 이러한 매개 변수가 무엇인지 공유하지 않지만 요청 지연이 가장 중요하다고 생각하지 않습니다. User-Agent, JS, referer는 어떻습니까? 당신이 이것을 만지지 않았다면, 그것은 "나는 봇"이라고 비명을 지른다. – leovp

답변