빠른 액세스 (O (n)보다 낫다)로 데이터를 저장하는 방법을 찾으려고합니다.대략적인 쿼리로 데이터를 저장하려면 어떻게합니까?
내 데이터베이스는 일부 항목에 대한 정보를 나타내는 데이터 (4096 바이트 문자열)로 구성됩니다.
문제는 쿼리가 절대 정확하지 않습니다. 하나의 Item을 얻은 다음 F(a,b)
함수를 사용하여 가장 가까운 항목을 찾아야합니다.
단지 예 :
1234
3456
6466
F(a,b) = return % of similar digits
GetClosest(1233,F) = 1234
문제가 있음을 F (a가, b) 복잡한 알고리즘 (안 적절한 측정)이다.
지금은 전체 데이터베이스를 검색하여 가장 적합한 항목을 검색합니다.
복잡성을 빨리 발견 할 수있는 종류의 트리 또는 다른 클러스터 데이터베이스 유형이 있습니까?
추가 정보 :
F는 % 비율의 유사도 값을 돌려 준다. 여기서 100 %는 완벽한 일치입니다.
실제 검색 프로세스 전에 데이터 색인을 다시 배열하거나 저장할 수 있습니까? – NirmalGeo
정확히 무엇을 의미합니까? –