2

자연어 처리에 사용할 수있는 사전이 거의 없습니다. 긍정적이고 부정적인 단어 사전 등어휘 사전

모든 사전 단어의 동의어 목록이 포함 된 사전이 있습니까?

등에 nice

synonyms: enjoyable, pleasant, pleasurable, agreeable, delightful, satisfying, gratifying, acceptable, to one's liking, entertaining, amusing, diverting, marvellous, good; 

답변

6

, 여기 NLTK 라이브러리에 파이썬 API를 예입니다 y, 단어는 여러 의미가 있습니다 (예 : 감각) :

>>> from nltk.corpus import wordnet as wn 
>>> wn.synsets('nice') 
[Synset('nice.n.01'), Synset('nice.a.01'), Synset('decent.s.01'), Synset('nice.s.03'), Synset('dainty.s.04'), Synset('courteous.s.01')] 

올바른 단어 감각을 사용하려면 문맥에 맞는 정확한 단어 감각을 알아야합니다.

>>> wn.synset('nice.a.01').definition() 
u'pleasant or pleasing or agreeable in nature or appearance' 

당신은 워드 감지 동음이 소프트웨어를 시도 할 수 있지만 (Anyone know of some good Word Sense Disambiguation software? 참조) 완벽하지. 단어의 의미를 알더라도, 워드 넷 항목은 제한적입니다. 많이 기대할 수는 없습니다 :

>>> wn.synset('nice.a.01').lemma_names() 
[u'nice'] 
>>> wn.synset('nice.a.01').similar_tos() 
[Synset('good.s.06'), Synset('pleasant.s.02')] 
>>> [i.lemma_names() for i in wn.synset('nice.a.01').similar_tos()] 
[[u'good'], [u'pleasant']] 
+0

. 내가 원하는 것은 : 주어진 단어/pharase에 대해, 나는 동의어/pharase를 원한다. 나는 PHP로 일하고있다. 더 이상의 참조? –

+0

http://thesaurus.com/을 크롤링 할 수는 있지만 데이터의 로컬 사본을 저장하려고 시도하면 법적 영향을주의하십시오.) – alvas

+0

아니요, 좋은 해결책이 아닙니다. 오프라인 데이터베이스가 필요합니다. 같은 텍스트 사전 파일 –

1

"WordNet® 영어. 명사, 동사, 형용사와 부사인지 동의어 (synset을)의 세트로 그룹화되어, 각각 별개의 개념을 표현하는 많은 어휘 데이터베이스입니다." :

Firstl : 워드 넷은 동의어를 찾는 시작하는 좋은 자원이지만, 하나의 제한 사항에 유의해야한다 http://wordnet.princeton.edu/

+0

감사합니다. 내가 원하는 것은 : 주어진 단어/pharase에 대해, 나는 동의어/pharase를 원한다. 나는 PHP로 일하고있다. 더 이상의 참조? 덕분에 –