2017-05-09 3 views
0

스트라스부르의 CDS에 대한 자연 언어 검색 엔진을 연구하고 있습니다. (스트라스부르 천문 데이터 센터) 스탠포드 품사 태거는 약어 태그 된 방법 약어 때때로 NNP로 태그, 때로는 단지 NN으로 태그로POS Tagger로 약어로 명사가 검색되었습니다.

나는 궁금했다.

"CDS"나 "NASA"와 같은 약어가 NNP인지 NN인지에 대한 정확한 결정 방법을 찾지 못했습니다.

누군가가 주제에 대해 도움을 줄 수 있다면 정말 기뻐할 것입니다. :)

좋은 하루 보내십시오.

답변

0

POS 태거는 월스트리트 저널의 수천 문장에 대해 훈련 된 통계 모델입니다. 단어에 어떤 문자 시퀀스가 ​​나타나고 문장에서 단어를 둘러싼 단어가 무엇인지 등의 요인에 의해 영향을받을 수 있습니다.

자세한 내용은 여기에서 확인할 수 있습니다. https://nlp.stanford.edu/software/tagger.shtml

관련 문제