2016-06-10 5 views
0

짹짹 메시지가 긍정적인지 부정적인지 예측하기 위해 AWS Machine Learning을 사용합니다. 약 1000 개의 트윗이있는 CSV 파일이 있습니다 (2 열 "메시지"텍스트 및 "is_postive"이진). 메시지에 내 편으로 정의한 일부 단어가 포함되어 있으면 "is_positive"가 0으로 설정됩니다 (다른 경우 1)AWS 기계 학습 문제

제 문제는 평가가 항상 1을 반환한다는 것입니다. "단어).

더 관련성있는 결과를 얻으려면 어떻게해야합니까?

도움 주셔서 감사합니다.

답변

1

데이터 소스로 이동하여 LM 모델을 선택하십시오. 속성을 클릭하면 교수 데이터의 열이 "통계적으로 관련성이 있음"을 알 수 있습니다. 귀하의 결과는 아마도 귀하의 교육 데이터 때문일 것입니다. 전체 트윗 메시지가 하나의 열에 있기 때문에 모델은 샘플 트윗의 모든 단어에 대한 상관 관계를 찾는 경향이 큽니다. 더 나은 모델은 대중이 사용할 수있는 버전이있는 "정서"라이브러리를 사용하는 것일 수 있습니다.이 버전에서는 모델이 현재 짹짹에서 짹짹까지 전체 단어를 볼 수 있도록 이동합니다.