2017-03-17 1 views
1

값을 예측하려고합니다. 나는 실제 목표 값을 사용할 때를 예측할 수 있는데, 며칠이지만 값의 로그를 사용하여 예측하려고하면 오류가 발생합니다. 나는 sklearn과 임의의 숲을 사용하고 있습니다.임의의 포리스트에서 로그를 사용하는 중 오류가 발생했습니다.

코드 :

X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1) 
Y = final_pressure_df['log_y'] 

X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5) 

forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5) 

forest.fit(X_train, Y_train) 

오류 : ValueError: Unknown label type: array([[ 3.91202301]

누군가가 제발 도와 드릴까요?

답변

0

분류가 아닌 회귀 분석이 필요하므로 RandomForestRegressor을 사용하십시오. 예측중인 변수가 실수 (실수) 인 경우 분류가 작동하지 않습니다. 그리고 첫 번째 경우에도 일수를 예측할 때 어떤 값이나 클래스/카테고리가 아닌 일 수를 예측하기 때문에 회귀 분석을 사용하는 것이 더 의미가 있습니다.

+0

고마워, 나는 그걸 시도해 봤어! – bim1

관련 문제