2017-04-25 1 views
0

I가 주어진 데이터 df X and Y 훈련하려는; Y 대상 변수 동안 X가 특징이다. 배열에에 ValueError : 순서로 배열 요소를 설정하는 경우 clf.fit

먼저 회전 안양

X = X1.values 
Y = Y1.values 

print(type(X)) 
<class 'numpy.ndarray'> 

print(type(Y)) 
<class 'numpy.ndarray'> 

그리고이 X이고 Y는 처음 두 행에 대해 다음과 같습니다 clf.fit(X,Y) 오류와 같은 : 나는 데이터를 양성하려하지만 때

print(X) 

[[1 100.0 10 -8.465 0 0.332 0.0565 0.47100000000000003 0.696 0.521 292987 
    4.0 0.302 0.0 [1, 2] [1] [1, 1, 1, 1] [0, 0, 1, 1, 0, 1, 0, 0]] 
[1 175.483 6 -8.205 0 0.364 0.128 0.564 0.504 0.705 239320 4.0 0.0752 0.0 
    [1, 2] [1] [1, 1, 1, 1] [0, 1, 0, 0, 0, 0, 0, 1]] 


print(Y) 

[1 0] 

:

ValueError: setting an array element with a sequence. 

문제는 벡터 내부에서 비롯된 것 같습니다. 엑스; 내가 뭘 해결할 수 있니? 감사합니다.

============================================== === 아니면 내가 질문은 생각 : 어떻게 데이터 교육을 위해 모두 부동 소수점 숫자와 벡터를 포함 dataframe을 처리하기 위해?

   Col_A   Col_B   Col_C 
0    0.0   [1, 2]   [1]  
1    0.0   [1, 2]   [1] 
+1

X와 Y의 이상한 형식은 무엇입니까? 혼합 배열과 부동 소수점 숫자? – languitar

+0

네,이 말이 옳지 않습니다. 왜 X에 배열이 중첩되어 있습니까? –

+0

안녕 얘들 아, 제발 편집 제발! 기본적으로 내 문제는 내 데이터 프레임 float 번호와 벡터를 모두 포함합니다. 데이터 교육을 위해 이것을 처리하려면 어떻게해야합니까? – user815408

답변

0

값을 학습자에게 전달하기 전에 배열이 포함 된 열을 개별 열로 분할해야합니다. 간단한 (수동) 방법은 다음과 같습니다.

In [18]: df 
Out[18]: 
    Col_A Col_B 
0  0 [1, 2] 
1  0 [3, 4] 

In [19]: pd.concat([df['Col_A'], df['Col_B'].apply(pd.Series)], axis=1).values 
Out[19]: 
array([[0, 1, 2], 
     [0, 3, 4]]) 
+0

는 기본적으로 나는 벡터에 텍스트를 변환, NLP를하고 있어요; 그래서 [1,2]는 예를 들어 음악 형식을 나타냅니다. 정말 목록을 깨고 훈련을 위해 다른 항목과 섞어도 되겠습니까? 항목별로 특징으로 – user815408

+0

보통의 분류는 일반 벡터를 받아 들일 것입니다. 그래서 당신은 그러한 표현을 생각해 내야하고, 평평한 표현에 포함 된 정보는 여전히 동일합니다. – languitar

+0

감사합니다. – user815408

관련 문제