데이터 [2-90]에 약 90 개의 변수가 저장되어 있습니다. 나는 그들 중 4 명이 데이터와 포물선과 같은 상관 관계를 가질 것이라고 생각한다 [1]. 상관 관계가있는 항목을 확인하고 싶습니다. 이 작업을 수행하는 쉽고 빠른 방법이 있습니까? 얻을^2/계수비선형 상관 관계 찾기 R
y <- data$AvgRating
x <- data$Hamming.distance
x2 <- x^2
quadratic.model = lm(y ~ x + x2)
, 그리고, R 보면 :
난 (I 각 변수 I = 2:90에 대해 루프로 할 수있다)과 같은 모델을 구축하는 시도 상관 관계에 대한 아이디어. 이 작업을 수행하는 더 좋은 방법이 있습니까?
아마도 R은 90 개의 변수로 회귀 모델을 만들 수 있으며 중요한 변수 자체를 선택할 수 있습니까? 그게 가능한가? 선형 회귀 분석을 위해 JMP에서이 작업을 수행 할 수 있지만 모든 변수를 R로 비선형 회귀 연산을 수행 할 수 있는지 확신 할 수 없습니다. 그러므로 나는 어떤 것들이 사전에 상호 연관되어 있는지를 볼 수 있는지 수동으로 시도하고 있었다. 그것을 위해 사용할 함수가 있다면 도움이 될 것입니다.
'데이터'의 구조는 무엇입니까? 벡터 목록입니까? 모든 벡터가 같은 길이입니까? –
그들은 모두 같은 길이입니다. 나는 그들을 data = read.csv ("file", header = TRUE)로 읽었습니다. 머리글과 관련 있다고 생각합니다. 작업 코드를 반영하도록 질문을 변경했습니다. – dorien
'data'가'data.frame'이라면'data [1]'은'data.frame' 열을 제공하고'lm'은 벡터를 기대합니다. 'data [[1]]'를 사용하여 벡터를 얻는다. – snaut