2011-12-15 8 views
3

최근에 R로 전환 했으므로 좋아합니다. 그러나 내가 가장 그리워하는 것들 중 하나는 미리 설정된 수준 (평균, 90 백분위 수 등)으로 특정 변수를 포함하는 예상 모델 응답을 생성 할 수 있다는 것입니다. 이것은 상호 작용 용어, 변형 된 변수 등의 효과를 식별하려고 할 때 엄청나게 유용합니다.변수가 일정하게 유지되는 예측 마진/예측 R

adjust 명령을 사용하여 Stata에서 쉽게 수행 할 수 있습니다. 나는 R에서 그것을하는 방법을 알아 내려고 노력했지만, R이라는 언어 (통계학 R도 있음)를 사용하고 "Adjust"와 같은 용어를 검색하는 큰 함정 중 하나는 오직 조정 된 R 제곱에 히트를 찾는 것처럼 보입니다. 그것은 실망스럽지 않습니다.

정말 쉬운 질문을 할 위험이 있으므로이 방법을 아는 사람이 있습니까? 나는 예측 마진을 살펴 봤는데, 적어도 관련 유형의 방법처럼 보이지만, 구현은 대개 설명 변수를 어떤 방식으로 표준화하는 것을 포함합니다.

+1

안녕하세요. 모델 예측 코드는 실행중인 모델의 종류에 따라 조금씩 다를 수 있으므로 해당 정보를 아는 것이 유용합니다. –

답변

1

당신이 실효/Hmisc 패키지 콤보로 캡슐화 된 묘사하는 작업의 종류. Frank Harrell은 저자이며 다른 출력 (일반 R 회귀 및 분석 작업의 향상된 버전)이 다양한 출력 테이블을 작성할 때 사용하는 datadist이라는 데이터 설명 개체를 작성합니다. 나는 당신이 "Hmisc-wheel"을 재발 명하고있는 것처럼 보이기 때문에 이것을 언급합니다. 물론 expand.grid 및 인수의 조합을 사용하여 predict에 자신 만의 버전을 만들 수도 있지만 필요하지 않을 수 있습니다. 프랭크의 R/S 세계에 대한 또 다른 중요한 공헌은 그의 작품과 다른 사람들의 작품의 대부분을 고품질의 데이터 분석을 수행하는 데 요약 한 "회귀 모델링 전략"텍스트를 매우 잘 고려한 것입니다.

+0

결국, 나는 rms 꾸러미를 사용하여 감았습니다.그것은 합리적으로 잘 작동합니다 : 'datadist (dataset) -> ddst 옵션 (datadist = 'ddst') Predict (model, var) -> myprediction' – Tom

0

모델 예측을 수행하려면 predict 함수를 사용하십시오. 예를 들어 ?predict.lmexample(predict.lm)을 참조하십시오.

위의 .lm 비트는 S3 클래스 시스템의 예입니다. 이 경우에는 "predict 함수를 lm 클래스의 객체에서 호출"을 의미합니다. 즉, 선형 회귀의 결과입니다. 일반적인 모델의 대부분은 자신의 버전 predict (해당되는 경우)을 사용할 수 있지만 모든 모델이이를 지원할 수있는 것은 아닙니다.

를 예측하고 그 예측에 대한 새로운 데이터 세트를 생성하여 작동에 대한 사실

이 조정은 정말 프론트 엔드입니다 :

2

http://www.stata.com/support/faqs/stat/adjust.html는 것을 말한다.

R의 predict은 예측 가정을 다양하게하기 위해 사용되지만, Stata의 adjust만큼 쉽지는 않습니다. transform도 중요 할 수 있습니다. 다음 예제를 참조하십시오.

# create model 
mtcars.lm <- lm(hp~disp*cyl,mtcars) 

# default fit predictions 

predict(mtcars.lm) 
      Mazda RX4  Mazda RX4 Wag   Datsun 710  Hornet 4 Drive 
      128.60896   128.60896   80.25811   128.88296 
    Hornet Sportabout    Valiant   Duster 360   Merc 240D 
      208.48842   128.79069   208.48842   75.58796 
      Merc 230   Merc 280   Merc 280C   Merc 450SE 
      76.29995   128.63021   128.63021   197.85671 
     Merc 450SL   Merc 450SLC Cadillac Fleetwood Lincoln Continental 
      197.85671   197.85671   222.63037   221.11516 
    Chrysler Imperial   Fiat 128   Honda Civic  Toyota Corolla 
      218.58981   83.79391   84.15593   84.71104 
     Toyota Corona Dodge Challenger   AMC Javelin   Camaro Z28 
      78.79793   203.18519   201.41745   207.22575 
    Pontiac Firebird   Fiat X1-9  Porsche 914-2  Lotus Europa 
      213.53912   83.75770   78.77380   81.81483 
    Ford Pantera L  Ferrari Dino  Maserati Bora   Volvo 142E 
      207.35202   128.56702   201.03865   78.68933 


# predict assuming all cars have 8 cylinders 

predict(mtcars.lm,newdata=transform(mtcars,cyl=8)) 
      Mazda RX4  Mazda RX4 Wag   Datsun 710  Hornet 4 Drive 
      183.2349   183.2349   176.6690   195.6091 
    Hornet Sportabout    Valiant   Duster 360   Merc 240D 
      208.4884   191.4423   208.4884   181.5556 
      Merc 230   Merc 280   Merc 280C   Merc 450SE 
      180.8106   184.1946   184.1946   197.8567 
     Merc 450SL   Merc 450SLC Cadillac Fleetwood Lincoln Continental 
      197.8567   197.8567   222.6304   221.1152 
    Chrysler Imperial   Fiat 128   Honda Civic  Toyota Corolla 
      218.5898   172.9694   172.5906   172.0098 
     Toyota Corona Dodge Challenger   AMC Javelin   Camaro Z28 
      178.1969   203.1852   201.4174   207.2257 
    Pontiac Firebird   Fiat X1-9  Porsche 914-2  Lotus Europa 
      213.5391   173.0073   178.2221   175.0402 
    Ford Pantera L  Ferrari Dino  Maserati Bora   Volvo 142E 
      207.3520   181.3409   201.0386   178.3105 

는 R과 관련된 주제를 검색하는, 당신은 유용한 다음 링크를 찾을 수 있습니다 : How to search for "R" materials?

관련 문제