2012-10-29 3 views
5

텍스트 (소셜 미디어의 게시물, 예를 들어 트윗, 페이스 북 벽 게시물, 유튜브 코멘트 등)에 감정 분류를하고 싶습니다. 비록 내가 주석이 달린 데이터로 좋은 데이터 세트를 찾을 수는 없지만. 나는 긍정적이거나 부정적인 데이터에 그 이상의 것을 찾고 있습니다. 몇 가지 감정을 가진 데이터 세트를 찾고 있습니다. 이것은 또는 불연속 값 (ekman 6 기본 감정) 또는 계속 값 (각성 - 원자가 모델) 일 수 있습니다. 누구든지 내가 그런 데이터 세트를 얻을 수있는 곳을 알고 있는가? 이것은 트위터, 페이 스북, 미니 홈피에서 올 수있다. ... 오랫동안 소셜 네트워크에서왔다.소셜 미디어에서 감정 분류 용 데이터 세트

답변

1

글쎄, 나는 더 나은 이름 (또는 더 자주 사용되는)이 될 것이라고 생각한다. 감정 분석 (감정 분류) - 정확합니까? 나는 소셜 미디어가 자신의 개인 데이터 (어쩌면 그것의 일부분)를 제공하는지 잘 모르겠다. https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts.movies.reviews에서 http://www.cs.cornell.edu/people/pabo/movie-review-data/ :

http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf

그들은 데이터를 다루고 : 어쨌든, 나는이 글을 발견했다.

적합합니까? 기본적으로 적절한 데이터를 찾는 것은 일반적으로 ML에서 큰 문제입니다. 종종 자신의 사이트를 만들 필요가 있습니다. (일부는 수동으로 분류하고 나중에 클러스터링 또는 반 감독 학습을 적용합니다.)

웹상에서 적절한 것을 찾지 못하면 연구자와 비슷한 기사를 쓰는 저자에게 연락하십시오. 어쩌면 그들은 당신에게 맞는 데이터 세트를 이미 만들었을 것입니다 ...

+1

감정 분석은 일반적으로 긍정적이거나 부정적 일 경우 텍스트를 결정합니다. 이는 내가 찾고있는 것과 다릅니다. 저자에게 연락하여 내가 찾고있는 것을 찾았지만. – Ojtwist

+0

@Ojtwist : 당신이 썼다 : "나는 여러 감정을 가진 데이터 세트를 찾고있다."나는 아직도 분류라고 생각한다. (예를 들어 여러 라벨을 가지고있다.) – xhudik

+0

교수가 당신에게 준 데이터 세트를 줄 수 있습니까? 왜냐하면 나는 그것을 필요로하기 때문에. – SOURAV

관련 문제