2
랜덤 포레스트를 사용하여 분류 문제를 해결하고 있습니다. BOW로 문장을 num로 변환하고 레이블을 넣고 트리를 만들었습니다.ValueError : scikit에 의한 임의의 포리스트 분류 learn
data_train = [[1.0, 1.0], [2.0, 2.0]]
label_train = [1,2]
estimator = RandomForestClassifier()
estimator.fit_transform(data_train, label_train)
및 예측을 시도하는 문장 인 test_data를 준비했습니다. 그러나 작동하지 않았습니다. 내가 아는
test_data = [[1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]]
label_predict = estimator.predict_proba(test_data)
ValueError: Number of features of the model must match the input. Model n_features is 2 and input n_features is 12
그것은, 내가이 think.How를 해결해야 요소의 수, 그것은 다른 달라야하는 문장에서 단어의 수를 해독제하지 않습니다라고? 당신의 예에서
감사합니다. 그래서 데이터의 의미를 바꾸지 않고 두 개의 열을 test_data로 만들어야합니다. (또는 train_data를 변경하십시오.) – user3119018
예, 대부분 각 열은 열차와 테스트 데이터에서 모두 같은 것을 나타냅니다. – elyase