답변

12

상관 관계는 단위 독립적입니다. 오브젝트 중 하나를 10 번 스케일하면 유클리드 거리와 상관 거리가 달라집니다. 따라서 상관 관계 메트릭은 발현 프로파일로 정의 된 유전자와 같은 개체 간의 거리를 측정하고자 할 때 탁월합니다.

흔히 절대 또는 제곱 상관 관계가 거리 메트릭으로 사용됩니다. 왜냐하면 우리는 기호보다 관계의 강도에 더 관심이 있기 때문입니다.

그러나 상관 관계는 고도의 차원 데이터에만 적합합니다. 2 차원 또는 3 차원 데이터 포인트를 계산할 시점이 거의 없습니다.

또한 "피어슨 거리"는 유클리드 거리의 가중 유형이며 피어슨 상관 계수를 사용한 "상관 거리"가 아닙니다.

5

정말 응용 프로그램 시나리오에 따라 다릅니다. 매우 간단히 말해서, 실제 값이 의 속성 값이 중요한 데이터를 다루는 경우 유클리드 거리로 이동하십시오. 추세 또는 모양 유사성을 찾고 있다면 상관 관계로 이동하십시오. 또한 각 객체에서 z- 점수 정규화를 수행하면 유클리드 거리가 피어슨 상관 계수와 비슷하게 동작합니다. Pearson은 데이터의 선형 변환에 민감하지 않습니다. 선형 및 비선형 변환 모두에 영향을받지 않는 값의 순위 만 고려하는 다른 유형의 상관 계수가 있습니다. 일반적으로 비차별로 상관 관계를 사용하는 것은 1 차원 상관 관계이므로 메트릭 거리에 대한 모든 규칙을 준수하지는 않습니다.

이 근접 측정은 예를 들어, 특정 응용 프로그램에 선택하는 몇 가지 연구가 있습니다

파블로 A. Jaskowiak, 리카르도 JGB 캄 펠로, 이반 G. 코스타 필류, 클러스터링 유전자 발현 마이크로 어레이 데이터에 대한 "근접 측정 : 검증 방법론 및 비교 분석, "전산 생물학 및 생물 정보학에 관한 IEEE/ACM 트랜잭션, vol. 99, no. PrePrints, p. 1,, 2013

관련 문제