확률 적으로 변화하는 부스트를 구현하기 위해 Python 용 Scikit 모듈을 사용하고 있습니다. 내 데이터 세트에는 2700 개의 인스턴스와 1700 개의 기능 (x)이 있으며 이진 데이터가 들어 있습니다. 내 출력 벡터가 'y'이고 0 또는 1 (이진 분류)이 포함되어 있습니다. 내 코드입니다예측 불가능한 결과를주는 확률 적 변화 부스트
gb = GradientBoostingClassifier(n_estimators=1000,learn_rate=1,subsample=0.5)
gb.fit(x,y)
print gb.score(x,y)
내가 그것을 실행, 1.0 (100 %)의 정확도를 가지고하면, 때때로 나는 (약 0.46의 정확도를 얻을 수 46 %). 성능에 큰 차이가있는 이유는 무엇입니까?
감사합니다. 나는 그것을 시도 할 것이다. –