2014-03-13 2 views
1

저는 sklearn 및 특히 linear_model 모듈을 사용하고 있습니다. 난 coef_ 및 intercept_ 통해 계수 및 절편에 액세스 할 수있는 방법을 참조Python scikit learn 선형 모델 매개 변수 표준 오류

import pandas as pd 
import numpy as np 
from sklearn import linear_model 
randn = np.random.randn 

X = pd.DataFrame(randn(10,3), columns=['X1','X2','X3']) 
y = pd.DataFrame(randn(10,1), columns=['Y'])   

model = linear_model.LinearRegression() 
model.fit(X=X, y=y) 

같이 간단한 선형 피팅 후 예측도 간단하다. 이 간단한 모델의 매개 변수에 대한 분산 - 공분산 행렬 및 이러한 매개 변수의 표준 오류에 액세스하려고합니다. 나는 R과 vcov() 함수에 익숙하다. scipy.optimize는이 기능을 가지고있다. (Getting standard errors on fitted parameters using the optimize.leastsq method in python) sklearn은이 통계에 접근하기위한 어떤 기능을 가지고 있는가 ??

감사합니다.

- 라이언

답변

4

아니, scikit 배우기 추론을 수행하는 내장 오류 추정이 없습니다. Statsmodels 그래도 않습니다.

import statsmodels.api as sm 
ols = sm.OLS(y, X) 
ols_result = ols.fit() 
# Now you have at your disposition several error estimates, e.g. 
ols_result.HC0_se 
# and covariance estimates 
ols_result.cov_HC0 

docs

+0

가에 대한 표준 오차를 계산하는 방법은 없나요 볼 scikit 배우기 당신이 scikit 회귀 모델에서 얻을 수있는 수치로? 나는 통계 모델이이 수치를 제공하지만 통계 모델에는없는 12- 패널티가 필요하다는 것을 알고 있습니다. – TheDude

+0

내가 아는 것은 아닙니다. L2- 페널티와 n> p의 경우 수식을 쓸 수 있다고 생각합니다. n eickenberg

+0

이 질문에 직접 답하는 것은 아니지만 예측 오류의 경우 [여기] (http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error)와 같이 평균 제곱 오류를 얻을 수 있습니다. html). 이는 예측 표준 오류를 향한 단계입니다. – ryanwc

관련 문제