sklearn python 모듈에서 kfolds 교차 유효성 검사를 사용하는 것을 이해하려고합니다. 예를 들어,sklearn cross_val_score 및 kfolds를 사용하여 모델 예측에 적합
- 인스턴스화 모델 : 나는 기본 흐름을 이해
model = LogisticRegression()
- 예 :
model.fit(xtrain, ytrain)
- 예 :
model.predict(ytest)
- 예 : 크로스 밸런스 스코어를 사용하여 적합 모델 정확도를 테스트합니다.
나는 혼란스러워서 sklearn kfolds와 교차점 점수를 사용하고 있습니다. 내가 이해하는대로 cross_val_score 함수는 모델에 적합하고 각 폴드에 대한 정확도 점수를 제공하는 kfolds를 예측합니다.
이 같은 사용하여 코드 : I 교육 및 시험 데이터와 데이터 집합을 가지고, 나는 각각의 배에 대한 내 훈련 데이터에 알고리즘의 정확성을 결정하기 위해 kfolds와 cross_val_score
기능을 사용하는 경우
kf = KFold(n=data.shape[0], n_folds=5, shuffle=True, random_state=8)
lr = linear_model.LogisticRegression()
accuracies = cross_val_score(lr, X_train,y_train, scoring='accuracy', cv = kf)
는 그래서, model
입니다 이제 테스트 데이터에 적합하고 예측할 준비가 되었습니까? 그래서 위의 경우에 사용 lr.predict
어떤 도움을 주셔서 감사합니다.
저는 그렇게 생각하지 않지만, 당신은'GridSearchCV'를 조사해야합니다. 기본적으로 여러분이 적합하고 예측할 수있는 모델과 비슷하기 때문에 거의 항상 cross_val_score 대신 이것을 사용합니다. 모델의 매개 변수를 튜닝하는 데 유용합니다. 매개 변수를 조정하지 않으려면'{}'을 전달하면됩니다. – justincai