현재 물류 회귀 및 임의 숲 (예 : scikit-learn)을 사용하여 신호를 추정하는 프로젝트를 진행 중입니다.신호 예측에서 잘못된 음성 속도 감소
지금 혼란 행렬을 사용하여 예측에서 다른 알고리즘의 성능을 예측하고 있는데 두 알고리즘 모두에 공통적 인 문제가 있음을 발견했습니다. 즉, 모든 경우에 알고리즘의 정확도는 비교적 좋지만 (약 90 % - 93 %) TP (FNR < 3 %)에 비해 FN의 총 수가 매우 높습니다. 어떤 사람이 내 예측 문제에서 이런 종류의 문제가 발생했는지에 대한 단서가 있습니다. 가능한 경우이 문제를 해결할 수있는 방법에 대한 힌트를 제공 할 수 있습니까?
미리 답변 해 주셔서 감사합니다.
업데이트 : 데이터 세트는 매우 불균형 (8 : 1)으로 총 180,000 회의 관측이 있습니다. 이미 OSS, SMOTE (+ Tomek 또는 + ENN)와 같은 여러 재 샘플링 방법을 테스트했지만 어느 것도 좋은 결과를 반환하지 않습니다. 두 경우 모두 리콜이 2.5 %에서 20 %로 증가하지만 정확도는 크게 떨어집니다 (60 %에서 20 %로).
라이브러리를 사용하고 있습니까? –
예, 저는 Scikit을 사용하고 있습니다. – Biertje