2016-10-19 5 views
0

는 내가이 얻을합 NumPy와 배열

[ 
[ 
    [0,0,0] 
    [1,0,0], 
    [0,0,1] 
], 
[ 
    [0,0,0], 
    [0,0,0], 
    [0,0,1], 
] 
] 

같은 모든 태그의 핫 인코딩이 배열을 원하는 한 태그는 동일한 크기로 채워집니다 ([0,0,0]은 태그 없음을 의미)

어떻게 할 수 있습니까? 나는 많은 것을 시도했지만 파이썬과 numpy의 멍청하다.

편집은 내가 그것을 실행하는 경우이해야

[np.sum(x, axis=0) for x in array_tags] 

하지만, 파이썬 (2.7) 붕괴를 작동 생각합니다. 어떤 단서?

+2

단순히 두 번째 축을 따라 합산하십시오 :'arr.sum (1)'? – Divakar

+0

'np.sum (tags_array, axis = 0)'을 사용해 보았지만 파이썬 붕괴 (9 번 죽이기)가 발생했습니다. 이유는 알 수 없습니다. –

+1

'axis = 1'은 어떨까요? – Divakar

답변

0

나는 scikit-learn에서 원하는 것을 발견했습니다. 내가 사용해야합니다 MultiLabelBinarizer