6
저는 NTLK/Python 초보자이며 CategorizedPlaintextCorpusReader를 사용하여 내 코퍼스를로드 할 수 있었지만 실제로 텍스트를 분류하고 데이터를 사용하는 방법은 무엇입니까?Python NLTK의 카테고리 분류에 내 자신의 코퍼스 사용
>>> from nltk.corpus.reader import CategorizedPlaintextCorpusReader
>>> reader = CategorizedPlaintextCorpusReader('/ebs/category', r'.*\.txt', cat_pattern=r'(.*)\.txt')
>>> len(reader.categories())
234
볼 (그러나 노트.. 당신의
cap_pattern
에서, 그 당신이 원하는 정말 무엇인지 확인하시기 바랍니다 당신은 샘플 및 모음에있는 파일 당 하나의 카테고리를 보인다) http://stackoverflow.com/questions/29275614/using-my-own-corpus- 대신 영화 리뷰 - corpus-for-classification-in-nltk – alvas