-1

GridSearch를 사용하여 임의의 포리스트 분류자를 자동으로 조정하는 방법이 있습니까? 값을 제공하는 대신 최적의 최적 매개 변수 값을 찾을 수있는 방법이 있는지 확인하십시오.sklearn을 사용하는 임의의 포리스트에서 자동 하이퍼 매개 변수 조정?

rfc = RandomForestClassifier(n_jobs=-1, max_features='sqrt', oob_score = True) 

    # Use a grid over parameters of interest 
    param_grid = { 
       "n_estimators" : [9, 18, 27, 36, 45, 54, 63], 
       "max_depth" : [1, 5, 10, 15, 20, 25, 30], 
       "min_samples_leaf" : [1, 2, 4, 6, 8, 10]} 

    CV_rfc = GridSearchCV(estimator=rfc, param_grid=param_grid, cv= 10) 
    CV_rfc.fit(train_x, train_y) 
    print CV_rfc.best_params_ 
+0

번호와 좀 더 많은 시간을 보내는 가치 [cross-validate] (https://stats.stackexchange.com/)에서이 질문을하면 왜 그렇지 않은지에 대한 자세한 답변을 얻을 수 있습니다. – ncfirth

+0

나는 이것이 교차 유효성 검사에 더 좋은 질문이라고 동의하지 않습니다. 내 경험에 비추어 볼 때 스코 츠 배움의 코드에 넣으려는 질문을 충분히 이해한다면 SO가 더 나은 곳입니다. –

답변

0

예, 거기에 거의 있습니다. print CV_rfc.best_params_ 라인을 사용하여 최상의 RF 매개 변수 세트를 이미 확인했습니다.

CV_rfc.fit(train_x, train_y)을 실행 한 후 CV_rfc 개체에는 이미 찾은 RF 매개 변수 집합이 포함 된 모든 열차 데이터에 RF 모델이 다시 입력되어 있습니다. CV_rfc.best_estimator_으로 '가장 좋은 모델'에 액세스 할 수 있습니다 (gridsearch 개체에 맞을 때 refit=False을 설정하지 않은 경우).

그래서 당신은 CV_rfc.best_estimator_.predict(test_x)와 테스트 데이터에 가장 잘 추 새로운 예측을 만들거나 할 수있는 편의도 CV_rfc.predict(test_x)

그것은 내가 제안하려는 documentation

관련 문제