저는 Weka의 분류 작업을하고 있으며, 예측할 클래스가 매우 빈번한 (약 85 %) 하나의 값을 가지고 있다는 문제가 있습니다. 이는 새로운 데이터 세트에 대해이 클래스의 빈번한 값을 예측하는 많은 학습 알고리즘으로 이어집니다.빈번한 수업 처리 방법은 무엇입니까?
어떻게이 문제를 해결할 수 있습니까? 단지 뭔가를 더 잘 예측할 수있는 기능을 찾지 못했습니까? 아니면이 문제를 해결하기 위해 할 수있는 구체적인 방법이 있습니까?
나는 이것이 매우 일반적인 문제라고 생각하지만, 여기에 대한 해결책을 찾을 수 없었다.
클래스! = 기능. –
가능한 [통계 패키지의 멀티 클래스 불균형 분류 도구] (http://stackoverflow.com/questions/12877153/tools-for-multiclass-imbalanced-classification-in-statistical-packages), [낮은 처리 방법 분류의 빈도 예]?] (http://stackoverflow.com/questions/17618532/how-to-deal-with-low-frequency-examples-in-classification) 및 기타 여러 가지 질문이 있습니다. –
빠른 도움을 제공해 주셔서 감사합니다. 이 질문들은 그 문제의 이름을 붙이는 방법과 그것을 해결하는 방법에 대한 힌트를줍니다. 그리고 용어를 섞어서 미안해. Weka는 처음에 orginally 그들을 배웠던 것과 다른 방식으로 그들을 사용합니다. – Martin