2014-09-15 4 views
0

스탠포드 분류기에서 단어 모델의 백에서 동의어 또는 다른 특정 두 개 이상의 단어를 단일 기능으로 간주 할 수 있습니까?스탠포드 분류기의 sysnonym 처리

예 : 나는 원하는 것이며 단일 기능으로 간주 될 수 있습니다.

+1

@tttthomasssss는 하버드 플럭스 보상 또는 커패시터

입니까? 'harvard flux compensator'에 대한 Google 검색 참조를 찾을 수 없습니다. – user2256866

+1

@ 커피, 나는 특정 단어/구 집합에서 하나의 기능을 만드는 분류자를 구축 중입니다. 예를 들어 '안녕하세요', '안녕하세요', '안녕하세요'는 단일 기능으로 처리해야합니다. – user2256866

+0

@ user2256866 - 위의 "harvard"행은 무시하십시오. 그것은 농담이었다 – Coffee

답변

1

질문을 정확하게 이해하지 못합니다. 당신이 분류하려고하는 것에 대해 좀 더 구체적으로 말하십시오.

하지만 일반적으로 분류 기준을 지정하기 전에 입력 내용을 변환 할 수 있습니다. 나는. "안녕하세요, 당신을 도울 수 있어요"를 "X, Y 도와주세요"여기서 X는 그룹 {안녕하세요, 안녕하세요, 안녕하세요, ...}의 자리 표시 자입니다.

이러한 그룹을 "synsets"라고도합니다. WordNet에서 (http://wordnet.princeton.edu/). 다음은 WordNet의 "hello"의 synset입니다. [1] 이것이 도움이된다면 WordNet에 액세스 할 수있는 API가 있습니다.

물론 이러한 단어 그룹을 수동으로 만들 수도 있습니다. 그러나이 그룹 중 하나를 배정하는 것이 매우 어렵다는 것을 모호하게 생각하는 단어가 많이 있습니다. [1] http://wordnetweb.princeton.edu/perl/webwn?s=hello&sub=Search+WordNet&o2=&o0=1&o8=1&o1=1&o7=&o5=&o9=&o6=&o3=&o4=&h=