2011-02-18 7 views
0

저는 Python에서 아주 새로 왔습니다.스파 스 표현을 사용하는 nltk.cluster

nltk.cluster 패키지를 사용하여 간단한 kMeans를 워드 문서 행렬에 적용하려고합니다. 행렬이 numpy 배열과 유사한 객체의 목록 일 때 작동하지만 csc_matrix, csr_matrix 또는 lil_matrix와 같은 드문 드문 한 행렬 표현에 대해서는 작동하지 못했습니다. 내가 찾은

모든 정보는했다 : 벡터는 NumPy와 배열과 같은 객체를 사용해야합니다

참고. 나는 이것이 무엇을 의미하는지 이해하지

을 필요할 때 nltk_contrib.unimelb.tacohn.SparseArrays는 효율성을 위해 사용할 수있다. 이 문제에 대해 아무도 도와 줄 수 없습니까?

미리 감사드립니다.

답변

1

입력 벡터를 전달할 때 numpy.array() 또는 nltk_contrib.unimelb.tacohn.SparseArrays를 전달할 수 있습니다.

nltk_contrib.unimelb.tacohn에서 SparseArrays 클래스를 찾으십시오. 그런 다음 nltk.cluster에 전달하기 전에이 클래스로 데이터를 작성하십시오.

+0

답장을 보내 주셔서 감사합니다. 패키지 nltk_contrib.unimelb.tacohn을 다운로드 할 수 있었지만 (매우 인기있는 패키지는 아닙니다). "nltk.cluster"함수에 nltk_contrib.unimelb.tacohn.SparseArrays 형식의 입력 벡터를 전달하면이 함수가 numpy.array 메서드를 계속 사용하려고하기 때문에 많은 오류가 발생합니다. 내 제품을 수정하여 SparseArrays 클래스에서 제공된 것을 사용할 수 있지만 다른 오류가 발생합니다. 따라서이 문제를 올바르게 해결하는 방법에 대해 확신하지 못합니다. – elachell

+0

원본 질문을 편집하여 시도한 내용, 코드 및 일부 URL을 포함 할 수 있습니까? 아마도 내 컴퓨터에서 테스트해볼 수 있습니다. –

관련 문제