2014-05-15 4 views
0

이 질문은 아마도 predict() 함수가 수행하는 작업을 완전히 이해하지 못했기 때문에 발생할 수 있습니다.하지만 근본적인 방법에 액세스 할 수 있는지 궁금합니다. 예측 데이터를 사용하여 주어진 관찰되지 않은 값에 대한 예측 간격을 얻을 수 있습니다. 여기의 의미는 다음과 같습니다선형 회귀에 대한 예측 간격을 얻는 방법 R

x <- rnorm(100,10) 
y <- x+rnorm(100,5) 

그리고 선형 모델 만들기 :

confint(mod1) 

을 얻을 : 나는 모델 추정에 대한 신뢰 구간을 원하는 경우에

mod1 <- lm(y ~ x) 

가, 내가 할 수

>     2.5 % 97.5 % 
(Intercept) -8.1864342 29.254714 
x   0.7578651 1.132339 

내가 원한다면 이러한 상한 및 하한 추정치를 예측 방정식에 연결하여 x의 일부 입력에 대한 신뢰 구간의 하한값과 상한값을 구하십시오.

동일하지만 예측 간격이 필요하면 어떻게해야합니까? 사용

predict(mod1, interval = "prediction") 

는 하부 및 상부 경계를 가지는 기존의 데이터 모델에 맞는처럼 보이지만 내가 관측 값을 사용할 수 있도록 그 하부 및 상부 경계의 기반이되는 매개 변수있는 말하지 않는다 .

(내가 기술적으로 예측() 명령에 값을 넣을 수 있습니다 알고 있지만 반드시 R의 예측을 할 필요가 없습니다 그래서 난 그냥 기본 매개 변수를 원하는)

답변

3

predict 기능은 받아 관찰되지 않은 값의 간격을 계산하는 인수 newdata. 여기에 예를

x <- rnorm(100, 10) 
y <- x + rnorm(100, 5) 
d <- data.frame(x = x, y = y) 

mod <- lm(y ~ x, data = d) 

d2 <- data.frame(x = c(0.3, 0.6, 0.2)) 
predict(mod, newdata = d2, interval = 'prediction') 

난 당신이 기본 매개 변수 무슨 뜻인지 몰라. 예측 간격의 계산에는 복잡한 공식이 포함되어 있으므로 몇 가지 간단한 매개 변수로 줄일 수는 없습니다.

관련 문제