답변
짧은 이야기 : 당신은 할 수 없습니다, 은색 총알이 없습니다. 모든 봇은 user-agent
문자열을 'googlebot'에서 'spamalot'까지 설정할 수 있습니다.
당신은 스스로를 볼 수 있습니다. 당신이해야 할 일은 신목이 가리키는 첫 번째 사이트로 가서 거기에 열거 된 Googlebot/2.X
봇을 모두 세는 것입니다. 당신은 그들을 차단하고, 봇의 이름을 횡설수설하는 등으로 바꿉니다. 결국 봇 (bot)인지 아닌지를 확인하려고 할 때 사용자로드 시간을 줄이는 10k 봇 목록으로 끝납니다.
Google에서이를 분석에서 어떻게합니까? – Himberjack
체크리스트 : http://www.botsvsbrowsers.com/category/1/index.html
그것은 4768 봇 사용자 에이전트의 총 수를 포함합니다.
봇 탐지를 수행하는 다른 방법은 화이트리스트 방식으로 역방향 접근법을 사용하는 것입니다. 즉, 사용자 에이전트가 봇이 아닌지 확인한 다음 다른 것이 봇입니다. :-)
비 bot 사용자 에이전트의 포괄적 인 목록을 컴파일하려면 http://www.user-agents.org/ 및 http://www.botsvsbrowsers.com/에 목록을 사용할 수 있습니다.
다른 하나 : http://www.useragentstring.com/pages/useragentstring.php – surfealokesea
- 1. HttpListener를 사용할 때 http 요청이 로컬인지 확인하는 방법
- 2. 요청이 완료되면 내 openid.op_endpoint를 확인하는 방법
- 3. 도메인 간 요청이 사용되지 않는지 확인하는 방법
- 4. HTTP 요청이 HttpApplication.AuthenticateRequest
- 5. HTTP 요청이 안전합니까?
- 6. Tomcat에서 HTTP 요청이 실패했습니다.
- 7. HTTP 응답이 완료되었는지 확인하는 방법
- 8. Blackberry HTTP 요청이 너무 느립니다.
- 9. SOAP HTTP 요청이 매우 느립니다.
- 10. PHP와 Apache를 사용하여 요청한 HTTP 버전을 확인하는 방법
- 11. 요청이 모바일 또는 컴퓨터에서 나온 것인지 확인하는 방법
- 12. PHP 리퍼러 : 요청이 실제로 어디에서 왔는지 확인하는 방법
- 13. 들어오는 HTTP 헤더 요청의 내용을 확인하는 방법
- 14. 요청이 프록시에서 오는 것인지 확인하는 방법은 무엇입니까?
- 15. Wicket에서 요청이 GET인지 POST인지 확인하는 방법은 무엇입니까?
- 16. http 요청이 특정 위치에서 발생하도록하는 방법은 무엇입니까?
- 17. HTTP 요청이 때때로 서버에 도달하지 않습니다. 왜?
- 18. 은 내가 어떻게 HTTP 요청이 제대로
- 19. HTTP 요청이 C# 프로그램에서 응답이 필요하지 않습니다.
- 20. 전화 걸기에서 HTTP 요청이 제대로 작동하지 않습니다.
- 21. 플래시 - HTTP 요청이 로컬 호스트에서 작동하지 않습니다
- 22. System.Web.Services.Protocols.SoapHttpClientProtocol.ReadResponse 요청이 HTTP 상태 404와 함께 실패했습니다.
- 23. HTTP 요청이 우선 동작 시작 - Android
- 24. C# HTTP 웹 요청이 시간 제한을 초과합니다.
- 25. HTTP 요청이 콘텐츠 길이를 설정하지 않습니다.
- 26. HTTP 처리기에 대한 동시 요청이 작동하지 않습니다.
- 27. HTTP 요청이 비동기 적으로 처리되는 HttpServlet입니까
- 28. 웹 요청이 Google의 크롤러에서 오는 것인지 확인하는 방법은 무엇입니까?
- 29. http 요청이 브라우저 또는 프록시 서버 (또는 서버)에서 발생하는지 확인하는 방법은 무엇입니까?
- 30. HTTP 호출에서 http 응답 헤더를 디버그하는 방법
프로그래밍과 어떤 관련이 있습니까? – sbi
HTTP 요청을 필터링하기 위해 필요합니다 – Himberjack
살고있는 곳이 Google입니까? 다행히 그것은 나를 위해 작동합니다. 여기 있습니다 : [http://www.user-agents.org/](http://www.user-agents.org/). –