텍스트를 분류해야하고 텍스트 blob 파이썬 모듈을 사용하여이를 달성해야합니다. Naive Bayes 분류기/의사 결정 트리 중 하나를 사용할 수 있습니다. 나는 아래 언급 한 점들에 대해 우려하고 있습니다.파이썬에서 텍스트 분류 - (NLTK 문장 기반)
1) 나는 문장으로 인수가 필요합니다/인수가 아님 : 저는 두 개의 분류자를 사용하고 적절한 데이터 세트를 사용하여 모델을 훈련시키고 있습니다. 내 질문에 대한 모든 키워드만으로 모델을 훈련해야합니까? 또는 가능한 모든 인수와 논증을 사용하여 데이터 집합을 훈련시킬 수 있습니다 샘플 문장? 텍스트 분류 정확도와 검색 시간 측면에서 가장 좋은 접근 방법은 무엇입니까?
2) 분류가 인수가 아닌/인수가 아니기 때문에 어떤 분류 기준에서 정확한 결과를 가져올 수 있습니까? Naive Bayes/Decision tree/Positive Naive Bayes입니까?
미리 감사드립니다.