2017-12-04 2 views
0

나는 사용자 정의 된 엔티티 태그를 정의하고자하는 프로그램 인 spaCy을 쓰고있다. 예제 here 다음에 파이프 라인에 MY_NEW_LABEL이라는 레이블을 추가합니다. 나는 위의 프로그램을 실행하면맞춤 스파이 엔터티 유형이 감지되는 이유는 무엇입니까?

import spacy 

nlp = spacy.load("en_core_web_lg") 

ner = nlp.get_pipe("ner") 
new_label = "MY_NEW_LABEL" 
ner.add_label(new_label) 

documents_path = "my_document.txt" 
document = nlp(open(documents_path).read()) 
print([e for e in document.ents if e.label_ == new_label]) 

그것은 MY_NEW_LABEL으로 표시 단체의 목록을 출력합니다. 나는 레이블로 무엇이든 할 수 없기 때문에 이것이 가능한지 모르겠다.

분명히 사용자 정의 엔티티 태그를 사용하는 방법을 오해하고 있습니다.하지만이 문제가 설명서에서 왜 발생하는지 알 수 없습니다. 아무도 내 프로그램이 빈 목록을 인쇄하지 않는 이유를 말해 줄 수 있습니까?

+0

안녕하세요, 저는 spaCy 관리자 중 한 명입니다. 실제로 이것은 매우 혼란스럽고 버그 일 수 있습니다. Google [issue tracker] (https://github.com/explosion/spaCy/issues)에서 문제를 열어서 새 라벨에 대해 인식되는 텍스트 및 엔티티의 예를 포함 시키시겠습니까? 오류를 재연 해보고 이것을 극복하는 것을 좋아할 것입니다! –

+0

나는 할 것이다. 내가 현재보고있는 텍스트는 독점적이지만, 충분히 긴 텍스트가 될 것이라고 생각합니다. –

답변

관련 문제