2
행동 마호침 (Mahout In Action) 책에 표시된대로 로이터 데이터에 LDA를 사용하는 예를 따르려고합니다. 그러나, 내가 그것을 실행하는 횟수에 관계없이, 나는 항상 오직 하나의 주제를 얻는다.LDA Mahout 단 하나의 주제
mahout lda -i reuters-vectors/tf-vectors -o reuters-lda-sparse -k 10 -v 34262 -x 20 -ow
내가 seqdumper를 실행 수를 가지고 :
나는 표시된대로 명령을 실행. LDA에서 더 많은 내용을 얻을 수있는 방법은Topic 0
===========
billion [p(billion|topic_0) = 0.04580929884162013
pct [p(pct|topic_0) = 0.043323700764985575
dlrs [p(dlrs|topic_0) = 0.031395871939373196
3 [p(3|topic_0) = 0.027311386657272094
1987 [p(1987|topic_0) = 0.025690077982656934
1 [p(1|topic_0) = 0.022727304049111215
reuter [p(reuter|topic_0) = 0.019572283708227903
mln [p(mln|topic_0) = 0.014569551610736616
april [p(april|topic_0) = 0.014453636611524965
march [p(march|topic_0) = 0.014359948846622552
있습니까 : 명령이 실행 된 후, 나는 다음과 같은 책에 표시된대로 LDAPrintTopics을 실행하고 얻을?
감사합니다.