디스크에 의이라는 n 개의 객체가있는 커다란 컬렉션이 있고 각각 가변 크기 문자열이 있다고 가정 해보십시오. 일반 문자열 비교를 통해 해당 개체의 인덱스를 만드는 효율적인 방법에 대한 일반적인 관행은 무엇입니까? 색인에 전체 문자열을 저장하는 것은 크기와 I/O에 장기간 소요되는 경우에는 매우 어려울 수 있지만 디스크의 참조 만 저장하면 대기 시간이 길기 때문에 좋은 아이디어는 아닙니다.문자열의 외부 색인을 효율적으로 저장하십시오.
tries과 함께 B-Tree와 유사한 디자인을 사용하려고 생각했지만이 방법을 사용하여 데이터베이스 구현을 찾을 수 없습니다. 사실, 주요 데이터베이스가 문자열에 대한 색인을 구현하는 방법을 찾기가 어렵습니다 (SQL 수준의 정보에 대한 방대한 결과에서 손실 될 수 있음).
TIA!
EDIT : "큰 문자열로 저장된 개체를 효율적으로 외부 정렬 및 검색"에서 "문자열의 외부 색인을 효율적으로 저장"으로 제목이 변경되었습니다.
예, 순서대로 트래버스해야합니다. 특히 범위를 찾아야합니다. 정말 고마워, 마침내 진짜 대답. – alecco