나는 트위터의 주제 모델링을 사용하여 무식한 트위터 사용자의 프로파일을 정의합니다. Gensim 모듈을 사용하여 LDA 모델을 생성합니다. 제 질문은 좋은 입력 데이터를 선택하는 것입니다. 특정 사용자에게 할당 할 주제를 생성하고 싶습니다. 질문은 입력 데이터에 관한 것입니다. 이제는 다른 카테고리의 사용자 (스포츠, IT, 정치 등)를 선택하고 모델에 트윗을 올리는 감독 된 방법을 사용하고 있지만 매우 효율적이고 효과적이지는 않습니다.파이썬에서 올바른 입력 데이터를 사용하여 Twitter의 좋은 LDA 모델 생성하기
전체 트위터의 의미있는 주제를 생성하는 좋은 방법은 무엇입니까?
주제 모델링의 주제가 레이블 또는 분류 태스크의 클래스와 다른 점에 유의하십시오. 사용하는 용어를 잘 이해하고 질문에 대해 다시 생각해보십시오. 너는 무엇을 알고 싶니? – jknappen