웹 사이트가 콘텐츠를 스파이더 링하는 경우 탐지하는 코드를 작성할 수 있습니까?웹 사이트 스파이더 링 자동 감지
1
A
답변
3
좋은 거미
- 는
- 그것이 있다면
- 는 일반 사용자
그러나 분명한 탐지보다 빠르게 쿼리하여 적절한 사용자 에이전트에게있는 robots.txt를 읽고 브라우저 또는 거미는 가능하지 않습니다.
1
사용자 에이전트 문자열을 사용하여 봇을 식별 해보십시오.
다른 봇은 다른 사용자 에이전트 문자열을 갖고있는 것 같다 :
http://www.useragentstring.com/pages/useragentstring.php
그러나 사용자 에이전트 문자열을 쉽게 스푸핑 할 수 있습니다.
1
일반 봇이 사용하는 사용자 에이전트 문자열 목록을 사용할 수 있습니다. 어떤 형태의 속도 감지를 사용하여 매우 높은 비율의 요청이 아마도 거미 (또는 전체 사이트를 떠나는 누군가)가 될 것이라고 판단 할 수 있습니다.
일반적인 봇에서 사용하는 IP 주소 목록도있을 수 있지만 바보 같은 검색 시스템은 거의 불가능합니다.
실제 방문자가 절대 클릭하지 않을 링크를 만들어 링크를 따르는 사람을 스파이더로 신고 할 수 있습니다. 어쨌든 어떤 사람들은 링크를 클릭하게되지만 호기심은 피할 수 없습니다.
1
스파이더가 좋은 경우 this과 같은 기존 사용자 에이전트 목록을 사용하여 사용자 에이전트를 통해 스파이더를 감지 할 수 있습니다. 그러나 대개 좋은 웹 스피더는 다음과 같습니다. robots.txt 컨벤션
robots.txt 파일을 무시하고 사용자 에이전트를 스푸핑하는 로봇은 다른 방법을 사용하여 스파이더임을 숨길 가능성이 큽니다.
관련 문제
- 1. 최고의 사이트 스파이더?
- 2. 웹 사이트 용 감지 장치
- 3. JQuery의 스파이더 웹 차트
- 4. VBScript ASP 웹 사이트 프로파일 링?
- 5. 웹 사이트 스파이더/로봇 파일 이름에서 공백 제거
- 6. Google은 스파이더 링 할 때 iframe의 내용을 볼 수 있습니까?
- 7. javacript/jquery를 통한 웹 사이트 변경 감지
- 8. 자동 감지
- 9. Cookieless = 자동 감지 웹 서비스 문제로 인해
- 10. Scrapy를 사용하여 스파이더 만들기, 스파이더 생성 오류
- 11. mysql에 결과를 던지기위한 스파이더
- 12. Google 번역을 사용하여 웹 사이트 자동 번역
- 13. 웹 사이트 솔루션의 하위 프로젝트 자동 컴파일
- 14. 자동 업데이트 asp.net 웹 사이트 bin 폴더
- 15. 루비 웹 스파이더 및 검색 엔진 라이브러리
- 16. Google 웹 로그 분석 : 스파이더 이미지
- 17. Emacs에서 언어 자동 감지
- 18. 자동 모드 감지
- 19. DB 인스턴스 자동 감지
- 20. 자동 응답기 감지 방법
- 21. 링크 검사기 (스파이더 크롤러)
- 22. robots.txt의 스파이더 간격
- 23. 기능 스테이플 링 대 사이트 정의
- 24. 자동화 된 웹 요청 감지
- 25. 자동 프로파일 링 Visual Studio 2008
- 26. 스프링의 자동 와이어 링 및 주석 구성
- 27. 자동 업데이트 사이트
- 28. 사이트 자동 새로 고침
- 29. 방향 변경시 이미지 자동 감지
- 30. 스파이더 웹을 그리는 방법