전체 텍스트 검색 엔진의 아키텍처를 설계하고 있습니다. 그 중 하나는 응답 시간이 거의없는 대형 데이터 세트 간의 쿼리 처리입니다. 내가 알아낼 수있는 한 가지는 반전 된 인덱스를 파티션으로 분할하는 것입니다. 이를 위해 용어 기반 파티션과 문서 기반 파티션이라는 두 가지 전략이 있습니다. 그러나 큰 데이터 세트 중에서 역변환을 빠르게하는 다른 방법이 있는지 정말 알고 싶습니다.역 색인 검색을 더 빠르게 만드는 방법은 무엇입니까?
4
A
답변
8
이 video은 분산 된 전체 텍스트 검색 엔진 ElasticSearch의 개발자 인 Shay Banon과 연설합니다. 비디오에서는 용어 기반 파티션과 문서 기반 파티션의 장단점에 대해 설명합니다.
기본적으로 용어 기반 파티션은 프로세스/노드간에 너무 많은 네트워크 대역폭을 생성합니다. 그리고 멋지게 구현하는 것이 더 어렵습니다. 문서 기반은 구현 및 결과 생성이 매우 간단합니다.
또한 그는 in this lecture by Jeffrey Dean의 차이점을 설명하고 Google이 문서 기반 파티션을 사용한다고 말합니다.
검색 엔진을 배포하는 두 가지 주요 방법입니다. 나는 그것을하는 다른 방법을 알지 못한다. 어쨌든 당신은 정보 검색 문헌에서 주제에 대한 새로운 연구를 원할 수 있습니다.
관련 문제
- 1. -sendSynchronousRequest를 더 빠르게 만드는 방법은 무엇입니까?
- 2. md5_file()을 더 빠르게 만드는 방법은 무엇입니까?
- 3. 파일의 목록을 더 빠르게 검색하기위한 색인 생성?
- 4. Symfony를 더 빠르게 만드는 방법
- 5. 프로세스를보다 빠르게 만드는 방법은 무엇입니까?
- 6. 스레드를 사용하여이 기능을 더 빠르게 만드는 방법은 무엇입니까?
- 7. GROUP BY SUBSTRING 쿼리를 더 빠르게 만드는 방법은 무엇입니까?
- 8. 이 FtpWebRequest 코드를 더 빠르게 만드는 방법은 무엇입니까?
- 9. Twisted Python Proxy를 더 빠르게 만드는 방법은 무엇입니까?
- 10. SLComposeViewController를 사용하여 presentViewController를 더 빠르게 만드는 방법은 무엇입니까?
- 11. UITableView에서 SwipeGestureRecognizer를보다 빠르게 만드는 방법은 무엇입니까?
- 12. 편집기 접기를 빠르게 만드는 방법은 무엇입니까?
- 13. django에서 Gmail 스타일 검색을 만드는 방법은 무엇입니까?
- 14. 범위를 더 빠르게 필터링하는 방법은 무엇입니까?
- 15. iPhone에서 픽셀을 더 빠르게 푸시하는 방법은 무엇입니까?
- 16. 아마존 API를 사용하여 서적 검색을 더 빠르게 만드는 방법은 무엇입니까? amazon api를 사용하여 서적 검색에 가장 적합한 응답 그룹은 무엇입니까?
- 17. 역 색인 생성
- 18. 검색을 더 효율적으로 만드는 Memcache db 모델
- 19. App Engine Datastore 사용자 검색을 더 빠르게 만들 수 있습니까?
- 20. CSS 컬럼 디자인을 빠르게 만드는 방법은 무엇입니까?
- 21. 인터페이스 빌더에서보기 컨트롤러를 빠르게 만드는 방법은 무엇입니까?
- 22. 내 홈페이지를 매우 빠르게 만드는 방법은 무엇입니까?
- 23. "모든 단어"검색을 만드는 방법은 무엇입니까?
- 24. PHP 페이지에서 Google 검색을 만드는 방법은 무엇입니까?
- 25. 검색을 사용하여 웹 조각을 만드는 방법은 무엇입니까?
- 26. 색인을 더 빨리 만드는 방법은 무엇입니까?
- 27. 역 색인을 만드는 가장 좋은 방법은 무엇입니까?
- 28. 분산 색인 및 분산 검색을 위해 solr1.4를 구성하는 방법은 무엇입니까?
- 29. 역 색인 목록을 구성하는 복잡성
- 30. 파이썬을 사용하는 역 색인 시스템