2014-10-18 2 views
1

나는 말렛을 사용하여 내가 정의한 토픽으로 다른 문서를 분류하려고한다. 말렛은 먼저 주제를 결정한 다음 문서를 분류하지만 첫 번째 단계는 건너 뛰고 싶습니다. 이미 관련 단어가있는 주제 목록이 있기 때문입니다. 말렛으로 문서를 분류하기 위해 만든 사전 정의 된 주제 목록을 사용할 방법이 있습니까?미리 정의 된 토픽을 말렛으로 사용하기

모든 안내에 감사드립니다. 감사!

답변

1

자습서가없는 경우 (예 : 각 주제에 대한 교육 사례가없는 경우), 주제를 쉽게 설정할 수 없습니다. 요점은 훈련 알고리즘이 사전에 관한 문서를 전혀 모르고 있다는 것입니다. 당신이 제공하는 기능에 따라 그것들을 분리/배포하려고합니다.

감독 학습을 수행하는 경우 주제는 실제로 수업이며 각 수업에 대한 문서가 있습니다. 그런 다음 알고리즘은 어떤 기능이 각 클래스에 대해 중요한지 학습하려고 시도합니다. 망치에서는 분류 모듈을 사용해야합니다.

특정 키워드에 따라 주제 배포를 통합하거나 기울이는 멋진 주제 모델링 아이디어가있을 수 있지만 Mallet에서는 가능하지 않다고 생각합니다.

관련 문제