2017-03-17 1 views
2

무작위 검색 및 그룹화 된 k 배 교차 유효성 검사 생성자를 사용하여 sklearn의 매개 변수를 통한 그리드 검색을 구현하려고합니다. 다음 작품 :그룹화 된 K fold cv generator를 사용하는 sklearn grid 검색

skf=StratifiedKFold(n_splits=5,shuffle=True,random_state=0) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=skf,n_iter=10) 
rs.fit(X,y) 

gkf=GroupKFold(n_splits=5) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
rs.fit(X,y) 

#ValueError: The groups parameter should not be None 

하지 않는이 어떻게 groups 매개 변수를 표시합니까?

어느

gkf=GroupKFold(n_splits=5) 
fv = gkf.split(X, y, groups=groups) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
rs.fit(X,y) 

#TypeError: object of type 'generator' has no len() 

답변

2

기준의 경우와,이

rs=sklearn.model_selection.RandomizedSearchCV(forest,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
위한

rs.fit(X,y,groups=groups) 

통해 이루어진다

관련 문제