2014-03-29 2 views
2

나는 많은 명목상의 속성을 가진 데이터 세트를 훈련시키고 싶다. 일부 게시물에서 명목상의 속성을 변환하려면 반복되는 이진 기능으로 변환해야한다는 것을 알았습니다. 또한 이렇게하면 개념적으로 데이터 세트가 희박해진다는 것을 알게되었습니다. 또한 scikit-learn은 빠르기 때문에 일부 견적기를 사용하여 희소 행렬을 사용한다는 것도 알고 있습니다. 그러나 일부 평가자는 여전히 희소 행렬을 허용하지 않는다는 것을 알게되었습니다. 내 질문은 : 지금까지 희소 행렬을 받아들이지 않는 것은 어느 것입니까?scikit-learn의 어떤 추정자는 희소 행렬을 지원하지 않습니까?

답변

3

scikit-learn의 메소드가 docstring을 검사하여 희소 행렬을 지원하는지 확인할 수 있습니다. 그것이라고 말하면

X : {array-like, sparse matrix} 

다음은 희소 매트릭스 입력이 지원됩니다. "배열과 비슷한"이라고 말하면 지원되지 않습니다.

관련 문제