0
다른 깊이의 의사 결정 트리에 대한 테스트 및 학습 오류를 계산하려고했습니다.다른 길이의 의사 결정 트리 오류
train_error = []
test_error = []
for i in range (3,21):
X_train, X_test, y_train, y_test = train_test_split(womendata, womeny, test_size=0.4, random_state=1)
decitiontree = tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=i, class_weight = 'balanced', min_samples_split=i)
clf = decitiontree.fit(X_train, y_train)
train_error.append(1 - clf.score(X_train, y_train) )
test_error.append(1 - clf.score(X_test, y_test) )
파이썬 3에서 나는 오류 얻을 : y는 같은 길이입니다
Traceback (most recent call last):
File "<stdin>", line 4, in <module>
File "/usr/local/lib/python3.4/dist-packages/sklearn/tree/tree.py", line 154, in fit
X = check_array(X, dtype=DTYPE, accept_sparse="csc")
File "/usr/local/lib/python3.4/dist-packages/sklearn/utils/validation.py", line 398, in check_array
_assert_all_finite(array)
File "/usr/local/lib/python3.4/dist-packages/sklearn/utils/validation.py", line 54, in _assert_all_finite
" or a value too large for %r." % X.dtype)
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
두 womendata 엔 여성을, 그리고 세트에는 누락 된 데이터가 없습니다.
이 작품은 무엇입니까? 그것을 고치기 위해 관리 하는가? – ShmulikA