2012-05-08 4 views
2

나는 여섯 가지 변수 (6D 공간 S를 형성)로 각각 기술 된 두 가지 유형의 개체, 예를 들어 M과 F가 있습니다. 나는 S에서 M과 F의 밀도가 최대로 다른 영역을 확인하고자한다. 먼저 여섯 가지 변수에 F/M을 연결하는 논리 이항 모델을 시도했지만이 GLM 모델의 결과는 해석하기가 매우 어렵습니다 (많은 중요한 상호 작용 용어로 인해 부분적으로). 따라서 저는 S에서 모든 곳의 M과 F 개인의 밀도를 개별적으로 추정하고 밀도의 차이를 계산하는 "공간적"분석을 생각하고 있습니다. 결국 나는 밀도에서 가장 큰 차이를 수동으로 찾고 6 변수에서 값을 추출합니다.다차원 공간에서의 밀도 추정 R

3d 공간에서 밀도를 예측할 수있는 sm.density 함수가 sm에서 발견되었지만 n> 3 인 공간에는 아무 것도 찾을 수 없습니다. 당신은 R에서 이것을 할 수있는 것을 알고 있습니까? 또는 첫 번째 질문 (두 번째 문장)에 대답하는보다 우아한 방법이 있습니까? 당신의 도움이

+0

다차원 밀도의 시각화에 초점을 맞춘'denpro' 패키지는 또한 (그리드상에서, 분명히) 그것들을 추정하는 함수를 제공합니다. –

답변

2

GLM 모델이 작업을 수행 할 수있는 능력에 대해 사전에

, 덕분에 많은 당신은 이미 수치 안정성 문제에 의해뿐만 아니라 발생 interpretablity 문제 모두에 의해 제한 될 수 있습니다. 또한 GLM 모델을 설명하지 않으므로 비선형성에 대한 고려가 포함되어 있는지 확인할 수 없습니다. 많은 양의 데이터가있는 경우 2D 교차 스플라인 용어 사용을 고려할 수 있습니다. (. 이들은 하지 정말 밀도 추정이) 나는 RMS의 시설을 초기 탐사를하고 있던 경우/Hmisc 패키지 다섯 차원이 같을 수 있습니다 VAR1의 동시 함수 형태를 표시해야합니다

library(rms) 
    dd <- datadist(dat) 
    options(datadist="dd") 

    big.mod <- lrm(MF ~ (rcs(var1, 3) + # `lrm` is logistic regression in rms 
         rcs(var2, 3) + 
         rcs(var3, 3) + 
         rcs(var4, 3) + 
         rcs(var5, 3))^2,# all 2way interactions 
        data=dat, 
        max.iter=50) # these fits may take longer times 
    bplot(Predict(bid.mod, var1,var2, n=10)) 

및 "5 차원"모델에 대한 var2의 기여도는 각각 10 점이고 세 ​​변수의 중간 값입니다.

3

함수 1~6

pdfClusternp 패키지에 이르는 치수 다항식 데이터 커널 밀도 추정을 수행 ks 패키지 kde 높은 차원 커널 밀도 추정을 수행하는 기능을 제안한다.

파라 메트릭 기법을 선호하는 경우, 가우시안 혼합물 추정을 수행하는 R 패키지는 mclust 또는 mixtools과 같습니다.