P.Liang의 갈색 클러스터링 코드 link으로 놀고있었습니다. 그것을 시도하기 위해, 나는 "자존심과 편견"이라는 텍스트를 중심으로 클러스터를 만들었다. 내가 가지고있는 클러스터는별로 좋지 않았습니다. 몇 가지 예,갈색 클러스터 만들기
"기쁘게 참조를 시도하는 더 기분"
"면제 식별 공제 서비스 반환"
"부적절 경악 재미있는"
"주소 놀라게 공개적으로 불성실 한 자만 무례"
클러스터를 유도하기 전에 일부 사전 처리 (예 : 불용어 제거, lemmatizing)를 수행해야합니까?