2017-03-21 1 views
1

스탠포드 NERFeatureFactory에 대한 자세한 설명은 어디에서 찾을 수 있습니까?스탠포드 NERFeatureFactory 설명

나는 하나를 읽었다 : https://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/ie/NERFeatureFactory.html 그러나 나는 그들 모두를 이해하지 못한다. 예를 들어

: usePrev, useWordPairs, conjoinShapeNGrams, useSum ... 또는 (PW, C) (t는, C)

더 나은 설명을하지 않고 similar question 2 years 전에 있었다. 그 이후로 새로운 것이 나왔는지 궁금 해서요.

도움 주셔서 감사합니다.

답변

0

NERFeatureFactory의 소스 코드를 살펴보면 어떤 일이 벌어지고 있는지 확인할 수 있습니다.

소스 코드는 여기에 있습니다 : https://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/ie/NERFeatureFactory.java 예를 들어

, useWordPairs은 고려 단어 및 이전/다음 단어에 대한 기능을 만듭니다. 당신이 텍스트 ...from New York...에 단어 New의 기능을 고려, 예를 들어

... 라인 1062에 시작하는 코드에서 볼 수 있습니다 ... useWordPairs는 기능을 기능을 생산 New-from-W-PWNew-York-W-NW

많은 기능에는 해당 파일에 대한 설명이 있습니다.

코드를 살펴보고 제작 내용을 확인하는 것이 좋습니다. 예를 들어 conjoinShapeNGrams 기능은 단어의 전체 모양과 단어의 하위 문자열을 첨부하는 기능을 생성합니다. 코드를보고 무슨 일이 일어나고 있는지 완전히 볼 수 있습니다. conjoinShapeNGrams의 예로서

는 등 worth-Xxxxxxxxxx-CNGram-CS, Words-Xxxxxxxxxx-CNGram-CS, 같은 기능을 얻을 것입니다 이름 Wordsworth이 ...

이 기능은 함께 특정 문자열과 단어 모양의 존재를 캡처 고려하십시오.

은 (PW는 c)

(t가, C)이 참조하는 usePrev 플래그에 링크 된 "이전 단어"와 "현재 단어"를 의미와 "현재 단어" "스피치 태그 부분" , 이는 당신의 대답을 ...

+0

덕분에 많은 그것은 useSum처럼 보이지 않는 useTags 플래그

에 연결되어 더 이상 아무것도하지합니다! "printFeatures = True"속성을 사용하여 어떤 기능을 사용했는지 확인할 수있었습니다. 코드에서 이러한 기능을 사용하는 모델을 볼 수 있습니까? 한 단어에 대해 여러 기능을 처리하는 방법을 이해하는데도 관심이 있습니다. 감사합니다. – yoann