내가 이렇게 같은 색 연결을 얻으려고 :word2vec 단어를 연상 시키는가?
apple -> red
banana -> yellow
grass -> green
sky -> blue
를 구글 뉴스 - 벡터 - negative300.bin 벡터를 사용하여, 내가 먼저 색상은 기본 색상 인
wv.similarity('apple',color)
, 예를 '시도 적색 ','황색 ','청색 '등이 포함됩니다.
과일과 함께'오렌지색 '은 항상 색상과 과일을 섞어서 가장 높은 색상 조합입니다. 나는 오렌지를 제거하면 결과는 여전히 이상한 :
apple:
[('violet', 0.24978276994901127), ('green', 0.20656763297902447), ('red', 0.19834849929308024), ('yellow', 0.18963902211016806), ('cyan', 0.17945308073294569), ('blue', 0.13687176308102386)]
cherry:
[('violet', 0.27348741504236473), ('red', 0.25540695681746473), ('yellow', 0.24285150471329794), ('blue', 0.20400566489159569), ('green', 0.18741563150077917), ('cyan', 0.12736182067644364)]
banana:
[('yellow', 0.27708333668133234), ('green', 0.25977272141145935), ('red', 0.24736077659820707), ('violet', 0.23909913025940599), ('cyan', 0.16519069493338848), ('blue', 0.15660144725154587)]
그래서 분명히 '바이올렛' '사과'와 다른 차원에 따라 '체리'와 정렬 (아마 그들은 식물이야?)
.나는 그것을 비유로 공식화하려고 노력했다. 이것은 일부 개체 근무하지만 잘 일반화하지 않습니다 나는 또한 페이스 북의 fasttext에 묻어을 시도했지만 결과는 나빴다
wv.most_similar(restrict_vocab=100000, positive=['apple','yellow'], negative=['banana'])
[(u'red', 0.5296207666397095), (u'orange', 0.501822829246521), (u'bright_yellow', 0.49562686681747437), (u'purple', 0.4909234642982483), (u'blue', 0.465557336807251), (u'pink', 0.43768370151519775), (u'colored', 0.4296746551990509), (u'brown', 0.4290006756782532), (u'bright_orange', 0.4261433482170105), (u'yellows', 0.4199957549571991)]
wv.most_similar(restrict_vocab=100000, positive=['grass','yellow'], negative=['banana'])
[(u'bright_yellow', 0.4722655713558197), (u'blue', 0.45448029041290283), (u'red', 0.43442922830581665), (u'lawns', 0.4275570809841156), (u'maroon', 0.4197036325931549), (u'bright_orange', 0.41167205572128296), (u'brown', 0.4110153317451477), (u'purple', 0.4074830412864685), (u'grassy', 0.4017237722873688), (u'striped', 0.40009182691574097)]
. 어떻게하면이 문제에 접근하여 "공통 색상"에 대한 벡터를 격리해야합니까?
감사합니다. 저는 벡터 수학 접근법을 시도해 보았습니다. 그리고 그것은 사물을 조금 개선하는 것처럼 보입니다. 방금이 프로젝트에 대해 알게되었습니다 : https://explosion.ai/blog/sense2vec-with-spacy 이 작업에는 완벽해야합니다. 나는 주황색과 보라색이 ADJ로 사용될 때 다른 의미를 가지지 않는다고 생각합니다. 그래서 POS 라인에 따른 감각적 인 명확성은 훨씬 더 나은 결과를 가져올 것입니다. – Jack000