2016-10-14 2 views
1

저는 파이썬에서 xgboost를 처음 사용했습니다. 오늘은 튜토리얼 (https://jessesw.com/XG-Boost/)을 따르려고했습니다.Python Xgboost GridSearchCV가 어떻게 작동합니까?

그럼 내 데이터를 사용하여 xgboost를 시도했지만 gridsearch를 사용하지 않아도 잘 작동합니다. 그런 다음 자습서를 따라 gridsearch를 수행했지만 작동하지 않는 것처럼 보입니다. 이건 내 코드입니다 :

cv_params = {'max_depth': [3, 5, 7], 'min_child_weight': [1, 3, 5]} 
ind_params = {'learning_rate': 0.1, 'n_estimators': 500, 'seed': 0, 
      'subsample': 0.8, 'colsample_bytree': 0.8, 
      'objective': 'reg:linear'} 

optimized_GBM = GridSearchCV(xgb.XGBClassifier(**ind_params), 
         cv_params, 
         cv=5, n_jobs=2, verbose=2) 

optimized_GBM.fit(train_x, train['label']) 

그리고이 출력을 가지고 :

Fitting 5 folds for each of 9 candidates, totalling 45 fits 
[CV] max_depth=3, min_child_weight=1................................  
//anaconda/bin/python.app: line 3: 906 Killed: 9  //anaconda/python.app/Contents/MacOS/python "[email protected]" 

어떤 조언을 주시면 감사하겠습니다을!

+0

다른 시스템에서 확인할 수 있습니까? 파이썬 인터프리터가 충돌하는 것 같습니다. –

+0

@IbraimGaniev는 방금 다른 컴퓨터에서 동일한 코드를 실행했지만 결과는 동일합니다. – snowneji

+0

해결되었습니다. 이것은 회귀 문제이므로 XGBClassifier() 대신 XGBRegressor()를 사용해야합니다. R을 사용하기 전에 파이썬의 차이를 깨닫지 못했습니다. – snowneji

답변

0

제 경우에는 이유가 colsample_by_tree에있었습니다. 전체 피쳐 수가 10보다 적 으면 0.1이었습니다.

그리고 n 트리 및 n 피쳐가있는 데이터 세트를 학습하려고 할 때 실패한 이유는 어설 션입니다.

관련 문제