아래의 데이터 세트에서 여행 소요 시간과 연령의 상관 관계를 찾고 싶습니다. 나는 cor(age,df$tripduration)
함수를 적용하고있다. 그러나, 그것은 나에게 출력 NA를주고있다. 상관 관계에 대해 어떻게 생각하는지 알려주세요.데이터 세트에서 상관 관계를 찾는 방법
age <- (2017-as.numeric(df$birth.year))
및 df$tripduration
등 tripduration(seconds)
: 나는 다음과 같은 구문으로 "나이"를 발견했다.
다음은 데이터입니다. 성별의 숫자 1은 남성을 의미하고 2는 여성을 의미합니다.
tripduration birth year gender
439 1980 1
186 1984 1
442 1969 1
170 1986 1
189 1990 1
494 1984 1
152 1972 1
537 1994 1
509 1994 1
157 1985 2
1080 1976 2
239 1976 2
344 1992 2
샘플 코드를 실행할 때 8.37 %가 발생하므로 입력 오류가 발생했을 것입니다. – lebelinoz