2016-08-24 1 views
0

그래, 필자는 페이스 북의 최신 텍스트 분류 파이썬 라이브러리를 가지고 노는 중이며 나는 라벨 인식에 어려움을 겪고있다.페이스 북의 라이브러리로 라벨 인식 Fasttext

입력이 txt 파일의 줄이어야한다는 것을 알고 있다면 각 줄에는 기능과 레이블이 모두 포함되어 있어야합니다. 레이블은 분류 자의 접두어 인 "__ label__"로 인식 할 수 있습니다.

하지만 간단한 테스트 코드를 실행할 때 제 분류자가 내 레이블을 인식하지 못하는 경우가 있습니다. 여기입니다 : "__label__"하지만 내 입력 파일에서 그들을 잡을 수 없습니다

__label__ 
[] 

그래서 코드는 접두사는 것을 알고 : 로그에 저에게이 결과를 제공

import fasttext 

classifier = fasttext.supervised('toto.txt', 'model') 
print classifier.label_prefix 
print classifier.labels 
raise SystemExit(0) 

. 왜 이런 일이 일어나고 있는지에 대한 아이디어가 있습니까?

도움 주셔서 감사합니다.

답변

1

도움을 얻으려면 의 내용을 "toto.txt"으로 표시해야합니다.

지금부터 볼 수 있듯이 제공 한 코드에는 아무런 문제가 없습니다.

(BTW, 그렇지 않으면 당신이 분류의 인코딩 PARAM을 설정해야합니다, 당신의 toto.txt이 'UTF-8'로 인코딩되어 있는지 확인)