일반 웹 브라우저뿐만 아니라 긁는 도구와 스팸봇이 만들어지지 않을 수도 있습니다. 이를 염두에두고, 요청을하는 방식을보고 노골적인 스팸봇을 발견 할 수있는 방법이있는 것처럼 보입니다.스팸 봇을 탐지하는 데 사용할 수있는 HTTP 헤더 필드가 있습니까?
HTTP 헤더를 분석하는 방법이 있습니까? 아니면 그냥 파이프 - 꿈입니까?
Array
(
[Host] => example.com
[Connection] => keep-alive
[Referer] => http://example.com/headers/
[Cache-Control] => max-age=0
[Accept] => application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
[User-Agent] => Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.44 Safari/534.7
[Accept-Encoding] => gzip,deflate,sdch
[Accept-Language] => en-US,en;q=0.8
[Accept-Charset] => ISO-8859-1,utf-8;q=0.7,*;q=0.3
)
신뢰할 수있는 서명이있는 로봇이 몇 개 있습니다. 대부분의 양식 스팸 크롤러는 재생 공격을 수행하거나 ActiveX 좀비입니다. (하지만 대상 사이트에 따라 달라집니다.)'Referer'-linkbots는 점점 희귀 해지고 있습니다. 그러나 "나쁜 행동"을 조사하십시오. – mario