2013-05-08 2 views
0

SPSS에서 몇 가지 더미 변수를 만들었고 R에서 동일한 변수를 사용할 수 있는지 궁금해하고 있었습니까? 변수 앞에 (category (...)와 같은) 특별한 코드를 추가해야합니까? 아니면 수정하지 않고 모델에 추가 할 수 있습니까?더미에 R을 어떻게 포함합니까?

나는 다단계 분석을하고 있기 때문에 나는 개인 변수를 문맥 변수로 사용하기를 원하기 때문에 R을 사용할 필요가있다.

미리 도움 주셔서 감사합니다. 친절한 답변, 로렌

+1

문제가 없습니다. 코드에서 실제로 문제가 발생 했습니까? 그렇다면 코드를 포함 시켜서 귀하의 우려 사항을 파악하십시오. – Thomas

+0

R이 변수를 범주 형으로 인식하고 모델을 만들 때 인형을 만들도록하려면 변수가 클래스 계수 여야합니다. 클래스 (객체)별로 클래스를 검사하거나 데이터 프레임 인 경우 str (df)로 검사 할 수 있습니다. factor가 아니라 숫자 변수이면 factor() 명령으로 변환 할 수 있습니다. 일이 아직 잘 풀리지 않으면 코드를 보여주십시오. – Edwin

답변

1

여기에 몇 가지 옵션이 있습니다. 먼저 @Edwin에서 제안한대로 factor() 함수를 사용하여 범주 형 변수를 factor 클래스로 변환 할 수 있습니다. R은 대부분의 선형 모델에서 요인을 자동으로 계산합니다 (모델 객체를 검사하여 볼 수 있음).

물론, 정의마다 허용되는 선형 모델에 1/0 더미를 간단하게 포함시키는 것을 방해하지 않는다고 생각합니다. 물론, 의미와 참조 ​​범주와 관련하여 수동으로 추적해야합니다.

따라서 첫 번째 전략이 가장 편리 할 것입니다.

다소 답을 넓히기 위해 R에 몇 가지 더밍 옵션이 있습니다. 기본값은 contr.treatment()으로 달성되는 더미 코딩입니다. 이것은 1/0 더미를 사용하며 순서가 지정되지 않은 요소의 기본 옵션입니다. 확인하려면 각각 options() 출력 부분을 참조하십시오. 그럼에도 불구하고 사용할 수있는 다른 유형의 명암이 있습니다. 내 경험상 편차 코딩은 종종 좋은 후보입니다. 단일 참조 범주 대신에 그룹 평균을 쌍 비교에 사용한다는 점에서 기본 대비 설정 방식과 다릅니다. 이것은 모든 국가를 하나의 특정 국가와 비교할 본질적인 이유가없는 국가 (또는 주)를 비교하는 것과 같은 경우에 흥미로울 수 있지만 모든 국가의 평균과 비교하면 의미가 있습니다. 이 유형의 명암은 contr.sum()으로 설정됩니다. 또는 직접 사용자 지정 행렬을 구성하여 contrasts(x) <- MyMatrix으로 입력 할 수도 있습니다.

R의 명암 유형에 대한 자세한 내용은 here입니다.

관련 문제