scikit의 계층 적 클러스터링 알고리즘 (scikit.cluster.Ward)을 실행하고 알고리즘의 첫 번째 반복 (각 관찰은 자체 클러스터)에서 마지막 반복까지 관찰이 클러스터 된 방식에 대한 전체 내역을 얻고 싶습니다. (하나의 클러스터에서 모든 관측). 겁 먹을 수 있니? 내가하고있는 정보는 각 반복마다 클러스터/관찰이 결합되고, 클러스터/관찰이 추가되며, 둘 사이의 거리입니다.Scikit Ward에서 클러스터 기록을 얻는 방법은 무엇입니까?
0
A
답변
3
모두가 ward.children
입니다. 각 라인은 어떤 2 개의 피쳐가 함께 클러스터되었는지 알려주므로 새로운 피쳐가 생성됩니다. 따라서 결국 클러스터가 성장할 때 색인을 생성하는 인덱스는 2 * n_features - 1
입니다.
import numpy as np
from scipy.ndimage import gaussian_filter1d
n_samples, n_feat1, n_feat2 = 400, 20, 20
X = np.random.randn(n_samples, n_feat1, n_feat2)
X = gaussian_filter1d(X, sigma=2, axis=1)
X = gaussian_filter1d(X, sigma=2, axis=2)
from sklearn.feature_extraction.image import grid_to_graph
connectivity = grid_to_graph(n_feat1, n_feat2)
from sklearn.cluster import WardAgglomeration
ward = WardAgglomeration(connectivity=connectivity)
ward.fit(X.reshape(n_samples, -1))
print ward.children
array([[ 35, 15],
[ 36, 16],
[ 34, 14],
[181, 180],
[201, 200],
[161, 160],
[241, 240],
[339, 338],
[221, 220],
[24, 4],
...])
0 개에서 399 개의 색인이있는 400 개의 기능이 있습니다. 첫 번째 병합은 피쳐 35와 15 사이에 있으며 피쳐 400이 생성됩니다. 두 번째 병합은 피쳐 (feature) 36과 16 사이에 있으며 피쳐 401이 생성됩니다. 세 번째 병합은 34와 14 사이에 있으며 402를 생성합니다.
은 0.17
에서 더 이상 사용되지 않으며 AgglomerativeClustering
으로 바뀝니다.
관련 문제
- 1. 다가오는 생일 주문에 기록을 얻는 방법은 무엇입니까?
- 2. scikit-learn howto 플로팅 문서 클러스터?
- 3. 지난주의 기록을 얻는 방법?
- 4. 주어진 아이템 ID에 대한 relist 기록을 얻는 방법은 무엇입니까?
- 5. IHS WAS 플러그인에서 클러스터 상태를 얻는 방법은 무엇입니까?
- 6. 프로그래밍 방식으로 Windows 검색 기록을 얻는 방법?
- 7. 기록을 파일로 리디렉션하는 방법은 무엇입니까?
- 8. 스택 기록을 삭제하는 방법은 무엇입니까?
- 9. 메서드 호출 기록을 가져 오는 방법은 무엇입니까?
- 10. Spark의 StreamingKMeans의 클러스터 센터를 찾는 방법은 무엇입니까?
- 11. Windows 검색 기록을 얻는 방법?
- 12. scikit-learn.k-means 라이브러리
- 13. kmeans 클러스터 센터를 나타내는 그림 표시 (Scikit learn)
- 14. Scikit-Learn- '분류되지 않은'카테고리를 추가하는 방법은 무엇입니까?
- 15. scikit-learn으로 스킵 그램을 구현하는 방법은 무엇입니까?
- 16. scikit-learn이 분류자를 저장하는 방법은 무엇입니까?
- 17. Scikit-learn에서 OneHotEncoder의 치수 수를 얻는 방법
- 18. scikit-learn DecisionTreeClassifier에서 정보 얻기를 얻는 방법?
- 19. Kubernetes 노드에서 실행되는 포드의 기록을 가져 오는 방법은 무엇입니까?
- 20. 로그/기록을 얻는 방법은 SVNKit을 사용하여 특정 파일 목록을 제공합니까?
- 21. SWT 브라우저 기록을 얻으려면 어떻게해야합니까? 네이티브 브라우저 기록을 얻는 다른 방법은 무엇일까요?
- 22. Youtube에서 사용자의 기록을 나열하는 방법은 무엇입니까?
- 23. android에서 브라우저 기록을 가져 오는 방법은 무엇입니까?
- 24. TortoiseSVN에서 잠금 기록을 보는 방법은 무엇입니까?
- 25. gerrit에서 기록을 다시 쓰는 방법은 무엇입니까?
- 26. UINavigation 기록을 지우거나 재설정하는 방법은 무엇입니까?
- 27. Eclipse에서 검색 기록을 삭제하는 방법은 무엇입니까?
- 28. git repo에서 중복 기록을 제거하는 방법은 무엇입니까?
- 29. 연결되지 않은 git 기록을 연결하는 방법은 무엇입니까?
- 30. 최고 기록을 저장하는 가장 좋은 방법은 무엇입니까?
잘못 읽었습니까? 아니면 데이터 세트의 열을 그룹화하는이 방법입니까? 다양한 감속 방식으로 행동합니까? 나는 행 (관측)이 일련의 피쳐들을 기반으로 함께 클러스터링되는 방법을 실제로 배우는 것입니다. 내 데이터를 조 변경 한 다음 알고리즘을 실행하면 ... 생각을 할 수 있을까요? – ADJ
그런 경우에는 'sklearn.cluster.Ward'를 사용하십시오. 열에 대해서도 동일한 작업을 수행합니다. 죄송합니다. 내 작업은 너무 많은 기능을 가진 공간 데이터를 사용하여 기능을 줄이는 데 유용합니다. – eickenberg
죄송합니다. sklearn.cluster.Ward는 원하는 작업을 정확하게 수행합니다. 이는 행에 작용합니다. – eickenberg