2016-09-13 3 views
-1

다 변수 가우스 분포에서 가져온 데이터 포인트의 클러스터를 생성하려고합니다.무작위 클러스터 생성

모든 클러스터에 동일한 공분산 행렬이 필요합니다. 나는 이것을 위해 clusterGeneration 패키지에서 genRandomClust 명령어를 사용하고있다.

하지만 위의 명령은 다른 공분산 행렬을 가진 클러스터를 생성합니다. 이 목표를 달성 할 수있는 명령이나 패키지로 나를 가리킬 수 있습니까?

답변

0

어때? 여기서 우리는 2 변량 정규 무작위 분포로부터 표본을 추출합니다.

library(MASS) 
Sigma <- matrix(c(10,3,3,2),2,2) # start with a fixed 2x2 covariance matrix, or generate it randomly 
Sigma 
datapoints <- mvrnorm(n = 1000, rep(0, 2), Sigma) # draw 1000 MVN samples with cov matrix Sigma, with mean c(0, 0) or use some random mean vector 
var(datapoints) # notice that the covariance matrix for the datapoint generated is slightly different from Sigma 
datapoints <- mvrnorm(n = 1000, rep(0, 2), Sigma, empirical = TRUE) 
var(datapoints) # here the covariance matrix for the datapoint generated is exactly equal to Sigma