-1

50 개의 저널을 상관 관계가있는 50 개의 매트릭스로 나타내는 데이터가 있습니다. 이제는 50 개의 저널이 데이터를 기반으로 어느 클러스터에 속하는지를 보여주는 그래프를 그려 봅니다.상관 계수에 대한 Python을 사용한 계층 적 클러스터링

1) 클러스터를 수행하려면 전체 연결 또는 와드 (Ward 's) 방법을 사용하는 것이 좋습니다. 2) 나는 scikit-learn의 문서가 나를 위해 너무 기술적이기 때문에 클러스터링을 시작할 위치에 머물러 있습니다 3) 킥 스타트를 도와 주시겠습니까?

는 상관 계수와 같이

내 모든 데이터

는 -1과 1 사이의 폭포 ... 사전에 대단히 감사드립니다. 데이터 샘플의

예 (50 * 50)

데이터 = [1 0.49319094 0.58838586 ... 0.11433441 0.6450184 0.60842821]

[1 0.49319094 0.39311674 ... -0.00795401 [1 0.58838586 0.39311674 0.42944597 0.68855177]

... 0.39785574 0.864322 0.68910632 ]

...

,745 [0.11433441 -0.00795401 0.39785574 ..., 1 0.38623474 0.34228516] 1,515,

[0.42944597 0.864322 0.6450184 ... 0.38623474 1 0.65408474]

[0.60842821 0.68855177 0.68910632 ..., 1 0.34228516 0.65408474 .]]

답변

0

파이썬은 의 거리 인을 기대합니다. 즉, 값이 낮을수록 좋습니다.

구는 유클리드 제곱에 맞게 설계되었으므로 상관 관계가 작용할 수도 있지만 이론에 의한 지원은 약할 수 있습니다. 완벽한 연결이 지원됩니다.

음의 상관 관계는 어떻게 처리합니까? 어떻게 처리 하시겠습니까?

  • 1 - abs(p)
  • 1 - p (이 취급합니다 (이 때문에 정사각형의 워드와 좋은 선택이 될 수 있습니다 구현에 따라)
    1. 1 - p**2

      가 :

      는 내가 세 가지 인기 변환을 알고 믿는 음의 상관 관계가 좋지 않음)

    메트릭을 precomputed으로 설정하십시오. 그리고 sklearn 문서를 읽는 데 익숙해 져야합니다. 그것은 당신이 찾을 수있는 최소한의 기술 중 하나입니다, 그래서 당신은 더 나은 기술 자신이 될 수 있습니다.

  • +0

    대단히 감사합니다. 예, 클러스터링을 위해 완전한 연결을 사용할 계획입니다. 많은 실험에서 읽은 것처럼, 1-abs (p)가 데이터 집합을 클러스터링하기 전에 음의 상관 관계를 처리하는 가장 좋은 방법이라고 생각합니다. – Amitsd

    관련 문제