2016-08-09 2 views
0

두 개의 누락 된 변수의 중첩을 얻고 상관 행렬과 유사한 히트 맵을 생성하는 간단한 방법을 사용하고 싶습니다.R에서 누락 된 두 변수의 중첩을 얻는 방법 (상관 행렬과 유사)

set.seed(123) 
data = data.frame(id = 1:1000, age_missing = sample(c(0,1),1000, replace = TRUE), salary_missing = sample(c(0,1),1000, replace = TRUE), 
address_missing = sample(c(0,1),1000, replace = TRUE), 
gender_missing =sample(c(0,1),1000, replace = TRUE)) 

이상적인 출력

|var1 | var2| Missing Percent| 
------------------------------ 
age  age 0.5 
age gender 0.05 
age address 0.08 
gender gender 0.15 
gender age 0.05 

답변

0

어쩌면 산출

dd <- as.matrix(data[,2:5]) 
crossprod(dd)/nrow(dd) 

의 라인을 따라 뭔가

   age_missing salary_missing address_missing 
age_missing   0.493   0.231   0.251 
salary_missing  0.231   0.497   0.248 
address_missing  0.251   0.248   0.494 
gender_missing  0.244   0.271   0.247 
       gender_missing 
age_missing    0.244 
salary_missing   0.271 
address_missing   0.247 
gender_missing   0.506 
+0

이 좋은 작품입니다 아래로 내가 가진 데이터는 ! 감사! – MYjx

관련 문제