나는 어떤 방식 으로든 비교하고 싶은 300.000 정도의 벡터 세트를 가지고 있는데, 주어진 하나의 벡터에서 나는 세 가지 방법을 생각한 가장 가까운 벡터를 찾을 수 있기를 원합니다.벡터 사이의 거리 측정
- 간단한 유클리드 거리
- 코사인 유사도
- 는 그람 행렬을 계산하도록 (예를 가우시안 용) 커널을 사용.
- 벡터를 이산 확률 분포로 처리하고 ( 감각을 만들어 냄) 일부 발산 측정을 계산합니다.
다른 것이 아니라 하나를 수행하는 것이 유용한 경우에는 실제로 이해가되지 않습니다. 내 데이터에는 제로 요소가 많이 있습니다. 이를 염두에두고 세 가지 방법 중 어느 것이 가장 좋을지에 대한 일반적인 원칙이 있습니까?
약한 질문에 대한 죄송합니다하지만 어딘가에 시작했다 ...
감사합니다!