이 질문에 대해 미리 사과드립니다. 나는 도움을 구하는 것이 매우 유용한 정보를 산출하지 못하도록하기 위해 노력하고있는 것을 모호하게 이해하고 있습니다.300 명의 사용자에 대한 상관 관계 실행 및 중요한 상관 관계를 기반으로하는 부분 집합
본질적으로 제 질문은 이것입니다. 나는 서로 지출 카테고리 "옷"사이에 어떤 상관 관계가 있는지보고 싶어
hh_ids date income consumption alcohol cleaning_materials clothing
1 KELDK01 2012-11-1 62.70588 40.52941 0 0.000000 0.000000
2 KELDK01 2012-12-1 17.64706 42.43530 0 1.058824 7.058824
3 KELDK01 2013-01-1 91.76471 48.23529 0 0.000000 0.000000
4 KELDK01 2013-02-1 91.76470 107.52940 0 0.000000 0.000000
5 KELDK01 2013-03-1 116.47060 114.47060 0 0.000000 0.000000
6 KELDK01 2013-04-1 124.41180 118.29410 0 2.705882 17.647060
7 KELDK01 2013-05-1 137.23530 105.00000 0 1.411765 1.882353
8 KELDK01 2013-06-1 131.52940 109.54120 0 4.352942 2.941176
9 KELDK01 2013-07-1 121.52940 113.47060 0 2.352941 25.882350
10 KELDK01 2013-08-1 123.32940 86.50588 0 2.588235 2.941176
: 나는 300 hh_ids 각각 12 행, 각 달 하나, 다음과 같습니다 데이터 프레임을 가지고 1 년 동안 각 가구에 대한 지출 범주 (약 10). 그런 다음 "의류"와 다른 지출 범주간에 중요한 상관 관계가있는 가구만으로 새로운 데이터 프레임을 만들고 싶습니다.
이 문제를 어떻게 해결할 수 있을지에 대한 의견이 있으십니까?
(ps 내가 "의류"와 다른 지출 카테고리 간의 교차 제품 대체인지 확인하고 해당 행동을 보여주는 HH를 분리하려고합니다. 내가 바보 인 경우 더 좋은 방법은 내가 당신의 생각을 듣고 드리겠습니다, 그것을 할 수 있습니다)
편집 :! 요청에 대한 응답으로 지금까지 작업을 볼 수 : 것을 생각 그것 오히려 당황하지만 난 manually-에 해왔습니다 나는 그것을 제대로하는 방법을 알아내는 동등한 시간을 보내고 싶다.
df_cloth에서 df를 하위 집합으로 지정합니다 (연도 중에 옷감이 0보다 큰 가구의 경우). 이는 140HH입니다.
나는 다음 않았다 :
df_cloth_cor<-select(df_cloth,income,consumption,alcohol,cleaning_material, clothing)
cor(df_cloth_cor)
나는 다음과 상관 관계가 각 변수 천에 대한 열, 가정에서 Excel에서 상관 계수를 기록했다.
지금까지 시도한 것을 보여 주시겠습니까? – shayaa