Deep Web을 검색하는 데 사용할 수있는 오픈 소스 라이브러리가 있습니까?딥웹을 검색하는 데 사용할 수있는 오픈 소스 라이브러리가 있습니까?
답변
xml over html을 사용하는 메타 데이터 수집을위한 Open Archives Initiative Protocol이 있습니다. http://www.openarchives.org/Register/BrowseSites
또한 깊은 웹 (Deepnet, 보이지 않는 웹, 어두운 웹 또는 숨겨진 웹)은 표면 웹의 일부가 아닌 월드 와이드 웹 콘텐츠를 말하며 표준 검색 엔진.
상업용 검색 엔진은 깊은 웹을 크롤링하기위한 대체 방법을 모색하기 시작했습니다. Sitemap 프로토콜 (Google에서 처음 개발) 및 mod oai는 검색 엔진 및 기타 이해 당사자가 특정 웹 서버에서 심층적 인 웹 자원을 발견 할 수있게하는 메커니즘입니다. 두 메커니즘 모두 웹 서버가 액세스 할 수있는 URL을 광고 할 수 있으므로 표면 웹에 직접 링크되지 않은 리소스를 자동으로 검색 할 수 있습니다. Google의 심층 웹 서핑 시스템은 각 HTML 양식에 대한 제출물을 미리 계산하고 결과 HTML 페이지를 Google 검색 엔진 색인에 추가합니다. 표면적 인 결과는 깊은 웹 콘텐츠에 대해 초당 수천 개의 쿼리를 처리합니다. 이 시스템에서는, 제출 사전 계산은 세 가지 알고리즘을 사용하여 수행된다
(1), 키워드를 접수 텍스트 검색 입력에 특정의 값을 수용
(2) 식별 입력 된 입력 값을 선택 (예 : 날짜) 및
(3) 웹 검색 색인에 포함하기에 적합한 URL을 생성하는 적은 수의 입력 조합을 선택합니다.
깊은 웹과 어두운 웹은 같은 것이 아닙니다. – ray
Google에서 이러한 페이지 중 아무 것도 색인으로 생성 할 수없는 경우 오픈 소스 라이브러리로 어떻게 할 수 있다고 생각하십니까? :)
즉, 조사를 시작하기에 좋은 곳이 될 수있는 딥 웹을 크롤링하는 것과 관련된 몇 가지 링크가 있습니다. 다음은 다른 몇 가지 예입니다.
- Deep Web Research에는 많은 유용한 참조 정보가 있습니다.
- deepwebtech.com은 깊은 웹 검색 엔진을 보유하고 있다고 주장하지만 현재는 다운되고 있습니다.
Google의 초점은 딥 웹이 아닙니다. 잠재 능력에 의문을 제기하는 것이 아니라 목적에 맞는 적합성에 의문을 제기합니다. 딥 (deep) 웹은 군수품 및 Google이 색인을 생성하는 데 적합하지 않은 여러 가지 주제와 관련하여 정보의 불법적 인 부분에 대한 방대한 자료입니다. '안전 검색'의 수준에 관계없이 분류 대상으로 분류됩니다. "오픈 소스"란 일종의 API를 통해 질의 할 수있는 해킹 저장소 계획을 의미합니다. – luvieere
군수품, 불법 정보 ... 여기 정확히 무엇을하려고합니까? –
- 1. 오픈 소스 포커 관련 수학 라이브러리가 있습니까?
- 2. 오픈 소스 명령 행 라이브러리가 있습니까?
- 3. 오픈 소스 AS3 역 기구학 라이브러리가 있습니까?
- 4. 순수 Python, BSD-ish 오픈 소스 SVG 라이브러리가 있습니까?
- 5. 많은 무료/오픈 소스 확장 방법 라이브러리가 있습니까?
- 6. Symbian에서 사용할 수있는 오픈 소스 웹 브라우저 앱이 있습니까?
- 7. Microsoft Compound Binary Files를 읽는 데 도움이되는 오픈 소스 라이브러리가 있습니까?
- 8. 사용자가 내 사이트에 메시지를 남길 수있게하는 데 사용할 수있는 오픈 소스 라이브러리는 무엇입니까?
- 9. 프록시 서버 작업을 수행하는 오픈 소스 라이브러리가 있습니까?
- 10. 간단하고 효과적인 오픈 소스 Java 데이터베이스 기반 큐 라이브러리가 있습니까?
- 11. C++에서 3D 차트 용 오픈 소스 라이브러리가 있습니까?
- 12. .NET 용 Non GPL 오픈 소스 PGP 라이브러리가 있습니까?
- 13. 이미지 스캐너와 인터페이스하기위한 오픈 소스 자바 라이브러리가 있습니까?
- 14. 오픈 소스 OCR
- 15. Android에서 사용할 수있는 비디오 편집 라이브러리가 있습니까
- 16. (gasp) ACT에 사용할 수있는 Python 라이브러리가 있습니까?
- 17. BigTIFF 형식을 읽을 수있는 오픈 소스 패키지
- 18. 비 GPL 오픈 소스 C \ C++ H264 인코딩 라이브러리가 있습니까?
- 19. BouncyCastle 외에 다른 오픈 소스 JCE 라이브러리가 있습니까?
- 20. 테이블의 데이터 패턴을 식별하는 일종의 오픈 소스 라이브러리가 있습니까?
- 21. iphone/ipad 용 무료 오픈 소스 차트 라이브러리가 있습니까?
- 22. 전기 회로도를 그릴 수있는 Javascript 라이브러리가 있습니까?
- 23. 오픈 소스 언어 번역 엔진
- 24. 상용 개발에 사용할 수있는 오픈 소스 svn 클라이언트 자바 라이브러리
- 25. COBOL에서 Java로 메시지를 보내는 데 사용할 수있는 모든 오픈 소스 메시지 대기열은 무엇입니까?
- 26. 오픈 그린에서 텍스처를 만드는 데 사용할 수있는 이미지 형식은 무엇입니까?
- 27. 도구 오픈 소스 검색에 도움이
- 28. 배울 수있는 잘 작성된 Perl 오픈 소스?
- 29. Polar 심박수 모니터 사운드 파일을 처리 할 수있는 오픈 소스 라이브러리가 있습니까?
- 30. 대위법 음악 파일에서 피아노 코드를 추출 할 수있는 오픈 소스 소프트웨어 또는 C# 라이브러리가 있습니까?
더 많은 데이터 또는 API를 사용하여 데이터를 수집하고 싶습니까? – Steve
API에 관심이 있습니다. – luvieere
매우 흥미로운 질문입니다 (+1).하지만 혼자서 작성해야 할 것 같습니다. – Phil