2017-01-01 1 views
0

두 개의 희소 scipy 행렬 은 각각 (284,183)(284,4195)입니다. 두 행렬의 각 행은 내 데이터 집합의 한 인스턴스에있는 피쳐입니다. 미리 정의 된 수의 클러스터없이 이들을 클러스터링 한 다음 플롯하려고합니다.Python에서 두 가지 기능 클러스터링

또한 각 행과 관련된 배열이 Y입니다. (284,1). 한 클래스는 0으로 표시되고, 다른 클래스는 1로 표시됩니다.이 점을 사용하여 포인트를 채색하고 싶습니다. 파이썬을 사용하여 이것을 어떻게 할 수 있습니까?

답변

0

클러스터링을 위해 skikit-learn Affinity 전파 또는 Mean-shift 라이브러리를 사용할 수 있습니다. 이러한 알고리즘은 다수의 클러스터와 센터를 출력합니다. Y을 사용하려면 몇 가지 다른 라이브러리를 가져 오지 않는 한 3D 평면에 다차원 점을 그릴 수 없으므로 다른 질문 인 것 같습니다.

+0

atm 내 평판이 충분하지 않아 내 의견에 답변 할 수 없기 때문에 위와 같은 내용이 아니라면 의견을 말하십시오. – MSPO

+0

Tesnorflow는 다차원 점을 시각화하는 데 유용한 라이브러리 중 하나입니다. 또는 점의 평균 거리에 대한 덤 드로 그래프를 사용할 수 있습니다. – MSPO

+0

Y는 1 또는 0으로 표시되는 두 개의 클래스입니다. 즉. 1이면 파란색, 파란색이면 0입니다. – user7347576

관련 문제