2013-08-15 1 views
-1

과일, 자동차, 접속사, 기사 등의 단어가 카테고리로 분류 된 정서 기반 카테고리 현명한 사전을 원합니다.정서 기반의 범주 사전은 어디에서 찾을 수 있습니까?

음수 및 양성 단어를 쉽게 분류 할 수있는 사전은 있지만 쉽게 찾을 수 없습니다.

+0

바나나의 정서는 무엇입니까?!? 나는 당신이 용어를 섞어 버리거나, 당신이 달성하기를 원하는 것에 대해 상당히 불분명하다고 생각합니다. ** 감정 ** 분석은 과일에 관한 것이 아니고 ** 긍정적이고 부정적인 감정 **에 관한 것입니다 ... 그래서 당신은 단지 긍정적이고 부정적인 단어 목록을 찾습니다. –

+0

@ Anony-Mousse : 과일 만 대상으로하지 않습니다. + ve와 -ve 단어를 기반으로 한 정서 분석은 한 가지 방법입니다. 도메인 특정 정서 분석을 위해서는 해당 도메인에 대한 정서 사전이 필요할 수 있습니다. 내 분석에서 특정 도메인 특정 단어를 제외하고 싶다고 가정하면이 범주 적 clissfication이 나를 도와 줄 것입니까? 투표를 할 이유가 없었습니다! – user123

+1

@Karimkhan 도메인 별 단어의 경우 직접 사전을 생성해야합니다. 그렇게하는 방법에 대한 내 대답을 참조하십시오. – philshem

답변

2

AFINN-111은 기본 정서 지수이지만 과일을 행복하게하려고하는 행운을 빕니다. 목록 here을 볼 수 있습니다.

AFINN-111에 긍정적 인 단어가있는 문장에 바나나 +1이 나타날 때마다 +1하고, 음수 단어가있는 경우 -1을 주어 AFINN-111에 추가 할 수 있습니다. 이렇게하면 바나나가 더 긍정적이거나 부정적인 맥락에서 나타나는지 분석 할 수 있습니다.

+0

당신이 말했던 것처럼이 목적을 위해 동적 인 참조 목록을 만들고 있지만 약간 다른 방식으로 작성하고 있습니다. 관련없는 단어를 제외하고 내 단어를 분류하고 있습니다. 최대 시간이되는 단어 "망고"를 가정 해 봅시다. 그래서 기사가 과일에 관한 것이라고 말할 수 있습니다. 그러나 분류 한 후 최대 시간을 나타내는 특정 단어를 가지고 있는데 어떤 범주에 속하는지 어떻게 결정할 수 있습니까? – user123

+0

답변은 응용 프로그램에 따라 크게 달라질 수 있습니다. 다음은 문서 분류에 관한 기사입니다 : http://en.wikipedia.org/wiki/Text_classification – philshem

관련 문제