유사성 지수를 선택할 때 고려해야 할 결정 요인은 무엇입니까? 어떤 경우에 유클리드 거리가 Pearson보다 선호되고 그 반대도 마찬가지입니까?특정 종류의 유사성 인덱스를 사용하는 방법을 아는 방법? 유클리드 거리와 피어슨 상관 관계
답변
상관 관계는 단위 독립적입니다. 오브젝트 중 하나를 10 번 스케일하면 유클리드 거리와 상관 거리가 달라집니다. 따라서 상관 관계 메트릭은 발현 프로파일로 정의 된 유전자와 같은 개체 간의 거리를 측정하고자 할 때 탁월합니다.
흔히 절대 또는 제곱 상관 관계가 거리 메트릭으로 사용됩니다. 왜냐하면 우리는 기호보다 관계의 강도에 더 관심이 있기 때문입니다.
그러나 상관 관계는 고도의 차원 데이터에만 적합합니다. 2 차원 또는 3 차원 데이터 포인트를 계산할 시점이 거의 없습니다.
또한 "피어슨 거리"는 유클리드 거리의 가중 유형이며 피어슨 상관 계수를 사용한 "상관 거리"가 아닙니다.
정말 응용 프로그램 시나리오에 따라 다릅니다. 매우 간단히 말해서, 실제 값이 인의 속성 값이 중요한 데이터를 다루는 경우 유클리드 거리로 이동하십시오. 추세 또는 모양 유사성을 찾고 있다면 상관 관계로 이동하십시오. 또한 각 객체에서 z- 점수 정규화를 수행하면 유클리드 거리가 피어슨 상관 계수와 비슷하게 동작합니다. Pearson은 데이터의 선형 변환에 민감하지 않습니다. 선형 및 비선형 변환 모두에 영향을받지 않는 값의 순위 만 고려하는 다른 유형의 상관 계수가 있습니다. 일반적으로 비차별로 상관 관계를 사용하는 것은 1 차원 상관 관계이므로 메트릭 거리에 대한 모든 규칙을 준수하지는 않습니다.
이 근접 측정은 예를 들어, 특정 응용 프로그램에 선택하는 몇 가지 연구가 있습니다
파블로 A. Jaskowiak, 리카르도 JGB 캄 펠로, 이반 G. 코스타 필류, 클러스터링 유전자 발현 마이크로 어레이 데이터에 대한 "근접 측정 : 검증 방법론 및 비교 분석, "전산 생물학 및 생물 정보학에 관한 IEEE/ACM 트랜잭션, vol. 99, no. PrePrints, p. 1,, 2013
- 1. 피어슨 상관 문제
- 2. matplotlib로 피어슨 상관 계수 플로팅
- 3. 하스켈 플로트 타입 충돌과의 피어슨 상관
- 4. spearman 상관 관계 그룹 별 R
- 5. MySQL에서 SELECT가 사용하는 인덱스를 아는 방법은 무엇입니까?
- 6. Matlab : 상관 관계 번호
- 7. 클러스터와 점의 상관 관계
- 8. Matlab 상관 관계 함수
- 9. BizTalk의 상관 관계
- 10. 신호의 상관 관계
- 11. 상관 관계 계산식 Matlab
- 12. 통계적 상관 관계 : Pearson 또는 Spearman?
- 13. 관련 텍스트 찾기 (두 텍스트 간의 상관 관계)
- 14. 목록의 모든 항목 간의 상관 관계 계산
- 15. 기기가 충전되는 방법을 아는 방법?
- 16. SubQuery SQL과 LINQ의 상관 관계
- 17. var_dump 기능을 사용하는 방법을 아는 방법은 무엇입니까?
- 18. 피어슨 상관 관계를 시계열을 사용하여 플로팅하는 방법은 무엇입니까?
- 19. 3D 공간에서의 거리와 z 깊이의 관계
- 20. 하위 쿼리 관련 상관 관계
- 21. 워크 플로를 사용한 상관 관계
- 22. 응답과 특정 설명 변수 간의 상관 관계 계산
- 23. 그래프 상관 관계 발견 알고리즘
- 24. MATLAB : 시드 영역과의 상관 관계
- 25. Matlab의 벡터 신호 상관 관계
- 26. 워크 플로 서비스 상관 관계
- 27. 이미지의 가장자리와 벡터의 상관 관계
- 28. 인앱 구매 거래 영수증과 보고서의 상관 관계
- 29. Oracle에서 상관 관계 서브 쿼리 피하기
- 30. 함수 기반 인덱스를 사용하는 방법