영향을받는 텍스트를 분류하는 라이브러리

예를 들어, 영향에 대한 영어의 텍스트 자동 분류를위한 라이브러리가 있습니까? 아주 거친면 여전히 충분히 좋을 것입니다.영향을받는 텍스트를 분류하는 라이브러리

2011-10-25 Alper

일반적으로 "영향력 분류"라는 용어가 사용되는 경우, 텍스트가 아닌 음성 데이터 처리 기술 - 화자가 분노하고 좌절하는지 판단하기 위해 스펙트럼, 소리 등의 오디오 기능 사용 이러한 유형의 기능은 분명히 텍스트로 잘 번역되지 않습니다.

텍스트를 분류 할 때, 텍스트 작성자가 텍스트의 주제에 대해 긍정적으로 또는 부정적으로 말하고 있는지 판단하기 위해 Sentiment, 일명 "의견 채광"을 분류하는 것이 더 일반적입니다. 이렇게하면 필요에 대한 충분한 뉘앙스를 제공 할 수 있습니다. 다행스럽게도이 문제를 해결하는 데 도움이되는 많은 리소스가 있습니다. Python에서 Natural Language Toolkit은이 유형의 작업에 자주 사용되는 분류자를 제공합니다 (예 : this demo).

이 접근법의 단점은 일반적으로 긍정적/부정적 분류에 국한되며 매우 특정한 도메인이라는 점입니다. 예를 들어 긍정적 인 영화 리뷰를 탐지하도록 훈련 된 분류 기준은 소프트웨어 검토 분류에서 제대로 수행되지 않습니다.

예를 들어 paper과 this one on identifying the emotional content of blog posts과 같이 텍스트의 감정 분류에서 수행 된 작업이 있습니다. 불행히도이 작업에 대한 '미리 준비된'라이브러리 지원은 거의 찾을 수 없지만 연구 정보를 보면 NLTK 또는 다른 분류/자연 언어 처리 라이브러리 위에이 유형의 시스템을 구축 할 수 있어야합니다.

출처

2011-10-25 18:16:57 bdk

은 "패턴"시스템은 감정 분석에 사용됩니다 :

벨기에 선거 6 월 13 일 2010-http://www.clips.ua.ac.be/pages/pattern
MBSP, 트위터 의견 마이닝 http://www.clips.ua.ac.be/pages/pattern-examples-elections
패턴 Python 용 텍스트 분석 시스템, http://www.clips.ua.ac.be/pages/MBSP

출처

2011-10-27 08:25:31

영향을받는 텍스트를 분류하는 라이브러리

답변

관련 문제