2012-04-29 2 views
1

저는 161X911 데이터 행렬을 0,1,2 's로 가지며, 행렬 전체에 NaN이 있습니다. 나는 시도하고 데이터를 함수 kmeans에 내장 된 실행하고 나는 5보다 큰 값을 K (클러스터의 수)가 때마다이 약이NaN을 가진 행렬에서 kmeans 함수가 실행됩니까?

Warning: Ignoring rows of X with missing data. 
> In kmeans at 128 
??? Error using ==> kmeans at 284 
X must have more rows than the number of clusters. 

있는가하는 방법을 반환? 나는 단지 5 행에 NaN이 없다고 생각합니다.

답변

1

K-Means를 사용하려면 숫자가 아닌 장소에 숫자를 입력해야합니다. 이를 수행하는 한 가지 방법은 각 열에 대해 비 NaN 값의 평균을 취하여 해당 열의 NaN을 해당 값으로 대체하는 것입니다.

관련 문제