2016-07-15 2 views
1

Product Quantization for Nearest Neighbor Search에서 섹션 IV.A에 대해서는 너무 거친 양자화기를 사용한다고 나와 있습니다 (느낀대로, 실제로는 더 작은 제품 양자화 기인 작은 k, centroid의 수).거친 양자화기를 사용해야하는 이유는 무엇입니까?

나는 이것이 검색 절차에 도움이되는 이유를 알 수 없으며 그 원인이 내가 사용하는 방식을 이해하지 못할 수도 있습니다. 어떤 ides 주세요? 제품과

비 소모적 인 검색 섹션에서 언급 한 바와 같이
+0

흠, 왜 이것이 아래로 투표 했습니까? 질문을 개선하기 위해 뭔가를 만들 수 있습니까? – gsamaras

답변

2

,

대략 최근 접 이웃 탐색은 신속하고 크게 는 디스크립터를 저장하기위한 메모리 요건을 감소 양자화 기.

그럼에도 불구하고 검색은 완전합니다.

거친 양자화 기는 비 한정적인 검색을위한 것입니다. 먼저 후보 집합을 검색 한 다음 PQ를 기반으로 후보 집합 내에서 가장 가까운 이웃을 검색합니다.

따라서 IMO의 성능은 대략적으로 양자화 기의 성능에 달려있다. 후보 세트가 진정으로 가장 가까운 이웃을 포함하지 않는다면, 우리는 이어지는 PQ 단계에서 그 후보 세트를 얻을 수 없다.

거친 양자화 장치는 ANN의 기본 알고리즘 중 하나이므로 PQ와 함께 사용할 필요가 없습니다.

+0

흠, 거친 양자화 기가 우리가 검색해야하는 목록을 가리키고 있습니다 ('w = 1'이라고 가정 해 봅시다). 그러나 나는 아직도 혼란 스럽다. 처음에는 거친 양자화가 무엇인가? 그것은 두 개의 양자화기를 섞어서 나는 의아해합니다! – gsamaras

+0

@ gsamaras 예. 그것은 일종의 인덱싱 방법과 같습니다. 셀 내의 포인트는 동일한 인덱스를 공유하므로, 동일한 인덱스의 포인트 만 검색하여 철저한 검색을 방지합니다. 거친 양자화 기는 후보 집합을 검색하는 데 사용되며, PQ는 정확도를 높이기 위해 정렬 속도를 높이기위한 것입니다. – dontloo

+0

OK, 모든 데이터베이스 Y (즉, Y의 모든 벡터 y)를 대략 양자화합니다. – gsamaras

관련 문제