2011-10-25 3 views

답변

2

일반적으로 "영향력 분류"라는 용어가 사용되는 경우, 텍스트가 아닌 음성 데이터 처리 기술 - 화자가 분노하고 좌절하는지 판단하기 위해 스펙트럼, 소리 등의 오디오 기능 사용 이러한 유형의 기능은 분명히 텍스트로 잘 번역되지 않습니다.

텍스트를 분류 할 때, 텍스트 작성자가 텍스트의 주제에 대해 긍정적으로 또는 부정적으로 말하고 있는지 판단하기 위해 Sentiment, 일명 "의견 채광"을 분류하는 것이 더 일반적입니다. 이렇게하면 필요에 대한 충분한 뉘앙스를 제공 할 수 있습니다. 다행스럽게도이 문제를 해결하는 데 도움이되는 많은 리소스가 있습니다. Python에서 Natural Language Toolkit은이 유형의 작업에 자주 사용되는 분류자를 제공합니다 (예 : this demo).

이 접근법의 단점은 일반적으로 긍정적/부정적 분류에 국한되며 매우 특정한 도메인이라는 점입니다. 예를 들어 긍정적 인 영화 리뷰를 탐지하도록 훈련 된 분류 기준은 소프트웨어 검토 분류에서 제대로 수행되지 않습니다.

예를 들어 paperthis one on identifying the emotional content of blog posts과 같이 텍스트의 감정 분류에서 수행 된 작업이 있습니다. 불행히도이 작업에 대한 '미리 준비된'라이브러리 지원은 거의 찾을 수 없지만 연구 정보를 보면 NLTK 또는 다른 분류/자연 언어 처리 라이브러리 위에이 유형의 시스템을 구축 할 수 있어야합니다.

관련 문제