2009-07-25 11 views
22

R에 어떤 기능을 사용하여 데이터에 곡선을 맞추고 해당 곡선이 얼마나 잘 맞는지 테스트하십시오. 어떤 결과가 좋은 것으로 간주됩니까?R 적합성 기능 R

+0

필자는 많은 수식 (원하는 경우 시간이 걸릴 수 있음)을 사용하여 가장 적합한 것을 찾는 상업용 소프트웨어를 사용했습니다. R에서 그와 비슷한 것을 발견하고 싶습니다. – Nosredna

+1

실망 - 저는 R이 실수의 영역이라고 생각했습니다. –

답변

25

그 질문의 첫 부분 만 전체 책을 채울 수 있습니다. 그냥 몇 가지 빠른 선택 : 표준 선형 모델 일반화 선형 모델

  • glm() 강력한에 대한 강력한 선형 모델 패키지 robustbase에서
  • lmrob()을위한 패키지 MASS에서 (로지스틱 회귀 분석에 대한 예)
  • rlm()에 대한

    • lm() 선형 모델
    • loess() 비선형/논 파라 메트릭 모델

    다음과 같은 도메인 특정 모델이 있습니다. 시간 계량, 마이크로 계량 경제학, 혼합 효과 및 훨씬 더. 예를 들어, Econometrics에서 자세히 논의합니다. 적합성에 관해서는, 그것은 또한 전체 책에 대해 쉽게 논의 할 수있는 것입니다.

  • +0

    적합성이 좋은 책이나 좋은 웹 사이트에 대한 권장 사항은 무엇입니까? –

    7

    nls() (http://sekhon.berkeley.edu/stats/html/nls.html) 함수는 비선형 최소 제곱 커브 피팅을위한 꽤 표준입니다. 카이 제곱 (제곱 된 잔차의 합)은이 경우에 최적화 된 메트릭이지만 정규화되지 않았으므로 적합도가 얼마나 좋은지 쉽게 판단 할 수 없습니다. 중요한 것은 잔류 물이 정상적으로 분배된다는 것입니다. 불행히도 나는 자동화 된 방법을 확신하지 못합니다.

    10

    중요 장비 에서 R은 lm(), glm()nls()입니다. 나에게 적합성 (goodness-of-fit)은 더 큰 모델 선택 문제의 하위 문제이다. 사실, 적합도를 잘못 사용하면 (예 : 단계별 회귀를 통해) 심각하게 잘못 지정된 모델이 생길 수 있습니다 (Harrell의 "회귀 모델링 전략"참고). 문제를 처음부터 논의하는 대신, 나는 Harlell의 책 lmglm을 추천한다. Venables와 Ripley의 성경은 간결하지만 여전히 가치있는 책입니다. Faraway의 "R을 사용한 선형 모델 확장"은 포괄적이며 읽기 쉽습니다. nls는이 소스에서 다루지 않지만 Ritz &의 "R을 사용한 비선형 회귀"Streibig는 그 차이를 메우며 매우 실용적입니다.

    3

    중요한 것은 잔여 물이 보통 인 입니다. 불행히도 나는 자동화 된 방법을 확신하지 못합니다.

    qqnorm()은 샘플 quantile과 이론 quantile 간의 상관 관계를 찾기 위해 수정 될 수 있습니다. 본질적으로 이것은 정상적인 분위수 음모의 수치 해석 일뿐입니다. 아마도 서로 다른 범위의 quantile에 대한 상관 계수의 여러 값을 제공하는 것이 유용 할 수 있습니다.예를 들어, 상관 계수가 데이터의 중간 97 %에 대해 1에 가까우며 꼬리에서 훨씬 더 낮 으면 이것은 잔차의 분포가 대략 정상이며 꼬리 부분에서 어떤 재미가 계속됨을 알 수 있습니다.

    +0

    'shapiro.test()'도 적합 할 수 있습니다. – DaveRGP

    2

    단순하게 유지하고 선형 방법이 "잘 사용"되는지 확인하는 것이 가장 좋습니다. 당신은 R 제곱 AND F 통계를 함께보고, 분리하지 않고 일반적으로 당신의 선량을 판단 할 수 있습니다. 종속 변수에 영향을주지 않는 변수를 모델에 추가하면 R2가 증가 할 수 있으므로 F 통계도 고려해야합니다.

    또한 모델을 다른 중첩 된 모델이나 더 간단한 모델과 비교해야합니다. 종속 변수가 동일하면 로그 유사 율 테스트를 사용하십시오.

    Jarque-Bera 테스트는 잔여 분포의 정규성을 테스트하는 데 적합합니다.