동일한 폴더에 cats.txt에 나열된 파일과 범주가 여러 개 있습니다. 나는 이것을 위해 태그 화 된 판독기를 분류하고 싶다. 분류 된 태그가있는 코퍼스 리더를 만드는 방법
내 파일의 모습입니다.
nltk에서 여러 가지 방법을 시도해 보았지만 분류 된 태그가 지정된 판독기를 만들지 못했습니다. 내 cats.txt 안에 파일 이름과 카테고리 이름이 공백으로 구분되어 있으며 각 파일 이름에 여러 카테고리가있을 수 있습니다. 예를 들어
:
mail_1_adapter 어댑터
mail_1_alert 경고
messagebody_24862499 다른
등 ...
당신이 나에게 내 신체를 만들고 우리를 만들 수있는 더 나은 방법을 보여 주시겠습니까 그것.
corpus_root = "C :/사용자/nkumarn/PycharmProjects/taggedcorpus/' ___________________________________ 리더 = CategorizedTaggedCorpusReader (corpus_root, R, cat_file = R'* \ 파일.. ''* \ TXT.. ') 이 내가 한 일이야. 그것은 작동하지 않았다. –
글쎄, 놀랄 일이 아니 었어. 'cat_file'은 정규 표현식이 아닌 파일 이름 (경로 포함)이어야합니다. 그리고 정말로'r '. * \. File''을 파일 패턴으로 작성 했습니까? 다음 번에 질문에 포함 된 코드와 오류를 포함 시키십시오. 그러한 게으른 질문을 쓰는 것을 중단하십시오, 이것은 내가 개선을 권고 한 첫 번째 질문이 아닙니다. – alexis
예. 알겠습니다. 고맙습니다 .... 필자는 질문 기준을 확실히 개선 할 것입니다. 조언 해 주셔서 감사합니다. –