저는 hcluster 모듈을 사용하여 거리 매트릭스에서 덴 드로 그램을 계산하고 있습니다.python hcluster, 거리 매트릭스 및 압축 거리 매트릭스
import hcluster
import numpy as np
mols = (..a list of molecules)
distMatrix = np.zeros((10, 10))
for i in range(0,10):
for j in range(0,10):
sim = OETanimoto(mols[i],mols[j]) # a function to calculate similarity between molecules
distMatrix[i][j] = 1 - sim
그때 축합 벡터에 행렬 변환 및 vecLink = hcluster.linkage(distVec)
와 결합 매트릭스를 계산하도록 명령 distVec = hcluster.squareform(distMatrix)
을 사용 내 거리 행렬은 다음과 같이 생성 된 배열의 배열이다.
이 모든 잘 작동하지만 거리 행렬이 아닌 압축 된 벡터를 사용하여 연결 행렬을 계산하는 경우 matLink = hcluster.linkage(distMatrix)
내가 다른 연결 행렬을 얻을 수 (노드 사이의 거리가 훨씬 더 크고 토폴로지는 약간 다릅니다)
이제는 hcluster가 압축 된 벡터에서만 작동하기 때문에 또는 내가 거기에서 실수를 저질렀는지 여부가 확실하지 않습니다.
도움 주셔서 감사합니다.
안녕 매트, 답장을 보내 주셔서 감사 많은. 벡터의 전달이 갈 길이라는 말을 듣고 안심할 수 있습니다. –