2012-05-15 4 views
2

내가 할 수있는 가장 명확하게되기를 바랍니다. 의 나는 내가 다른 6 나를 위해 내가 X.회귀 분석 또는 Anova?

이 변수의 각 하나를 (전화 다른 현상을 나타내고 Y. 전화 중 4 나를 위해 특정 현상을 대표하는 10 개 변수와 데이터 집합을 가지고 있다고 가정 해 봅시다 10)에는 37 개의 단위가 들어 있습니다. 그 단위는 나의 분석의 응답자 일뿐입니다 (설문 조사). 모든 질문은 리 커트 척도를 기반으로하므로 질적 변수입니다. 스케일은 모두 0에서 7까지이지만, 답이없는 경우 "-1"과 "-2"값이 있습니다. 따라서 규모는 실제로 -2에서 7로 이동합니다.

내가 원하는 것은 내 Y (이 경우 4 개의 변수와 각 변수에 대한 37 개의 답변이 포함되어 있음)와 X (6이 포함 된) 사이의 회귀를 계산하는 것입니다. 변수 대신에 응답자 수). 나는 회귀 대신에 Anova를 사용해야한다는 것을 질적 분석을 위해 알고있다. 회귀를 할 수있는 곳은 어쩌면 일 수도있다.

은 지금까지 나는 이런 식으로 행동하는 것을 시도했다 :

> apply(Y, 1, function(Y) mean(Y[Y>0])) #calculate the average per rows (respondents) without considering the negative values 

> Y.reg<- c(apply(Y, 1, function(Y) mean(Y[Y>0]))) #create the vector Y, thus it results like 1 variable with 37 numbers 

> apply(X, 1, function(X) mean(X[X>0])) 

> X.reg<- c(apply(X, 1, function(X) mean(X[X>0]))) #create the vector X, thus it results like 1 variable with 37 numbers 

> reg1<- lm(Y.reg~ X.reg) #make the first regression 
> summary(reg1) #see the results 
Call: 
lm(formula = Y.reg ~ X.reg) 

Residuals: 
    Min   1Q  Median  3Q  Max 
-2.26183 -0.49434 -0.02658 0.37260 2.08899 

Coefficients: 
       Estimate Std. Error t value Pr(>|t|)  
(Intercept)  4.2577  0.4986  8.539 4.46e-10 *** 
X.reg   0.1008  0.1282  0.786 0.437  
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.7827 on 35 degrees of freedom 
Multiple R-squared: 0.01736, Adjusted R-squared: -0.01072 
F-statistic: 0.6182 on 1 and 35 DF, p-value: 0.437 

을하지만 당신이 볼 수 있듯이, 6 4 개 변수 X에 의해 구성으로 나는 Y를 사용하지 않지만, 나는 부정적인 생각하지 않는다 가치도, 나는 R^2로서 매우 낮은 점수를 얻습니다.

내가 ANOVA 행동하면 대신 나는이 문제가 :

> Ymatrix<- as.matrix(Y) 
> Xmatrix<- as.matrix(X) #where both this Y and X are in their first form, thus composed by more variables (4 and 6) and with negative values as well. 

> Errore in UseMethod("anova") : 
    no applicable method for 'anova' applied to an object of class "c('matrix', 'integer', 'numeric')" 

정직하기를, 며칠 전 나는 ANOVA를 사용하여 성공하지만, 불행하게도 나는 내가 명령을 저장하지 않은 방법을 기억하지 않습니다 어딘가에.

내가 알고 싶은 것입니다 : 모든

  • 첫째,하고 나는 내 문제에 접근하는 방법에 잘못?
  • 회귀 결과에 대해 어떻게 생각합니까?
  • 마지막으로 어떻게 anova를 만들 수 있습니까? 내가해야만한다면.

답변

0

응답 (Y) 및 예측 자 (x)가 숫자 척도이면 회귀를 사용할 수 있습니다. 응답 (Y)이 예측 변수가있는 숫자 척도 (x)가 범주 척도이면 ANOVA를 사용할 수 있습니다.

추천 :

회귀 분석 방법을 사용하기 전에 답변 (표시기)이 응답 및 예측 자에 대해 유효하고 신뢰할 수 있는지 여부를 확인하려면 유효성 및 신뢰성 테스트를 사용해야합니다.

0

나는 Denny의 답변에 동의하지 않습니다. 보유하고있는 데이터의 유형에 관계없이 두 가지 방법 중 하나를 사용할 수 있습니다. 범주 형 데이터가 있으면 더미 인코딩을 사용하여 숫자로 표현할 수 있습니다. 예를 들어, 1, 2 및 3과 같이 3 개의 옵션이있는 기능 x가 있으면 3 개의 새로운 추가 변수 x1, x2 및 x3을 만들어 숫자로 인코딩 할 수 있습니다. x가 1이면 x1은 1, x2는 0, x3는 0이됩니다. x가없는 경우 세 개의 새 x 값은 모두 0입니다.

당신의 경우에는 회귀 현상을 먼저 시도하는 것이 좋습니다. 그 이유는 가지고있는 기능의 양 때문에 그리고 곧장 앞으로 나올 수 있기 때문입니다. ANOVA는 피쳐 수가 증가함에 따라 복잡해질 수 있습니다. 귀하의 데이터가 두 기술에서 요구하는 가정을 충족한다고 가정 할 때 두 가지 모두 작동해야합니다.