먼저 WEKA 초보자라고 말해 보겠습니다.Weka - 편파/바이어스 결과를 제공하는 이진 분류
특정 메트릭을 사용하여 인스턴스에 대해 예/아니오 응답을 얻는 2 진 분류 문제로 WEKA를 사용하고 있습니다.
a b <-- classified as
190 0 | a = yes
98 0 | b = no
이 절대 분리의 경우 :
여기 BayesNet 나는 288 개 인스턴스와 세트있어 혼란 매트릭스가 '예'(190)와, 그리고 98 '에는'값을 사용하지 않고, 문제를 예시하기 다른 분류 자들도 있지만, 그것들 전부는 아닙니다. 즉, 분류 자의 등급이 극도로 분류되지 않은 경우에도 주류에 대한 확실한 편향이 있습니다. 예를 들어, RandomForest의 결과는 다음과 같습니다.a b <-- classified as
164 34 | a = yes
62 28 | b = no
나는 아주 분명하게 뭔가를 놓치고 있습니다.
그럼 뭐가 궁금한가요? 우위의 클래스는 다른 클래스의 거의 두 배입니다. 그렇습니다. 모든 분류기에는 편향이 있습니다. –
그 결과가 지배적 인 클래스 법선에 대한 총 바이어스를 나타내는가? 예를 들어, BayesNet을 사용하면 Kappa 통계 값이 0 인이 일면 결과를 항상 얻을 수 있습니다. 내가 사용하는 데이터 세트 또는 메트릭에 관계없이. 이게 어떻게 작동할까요? RandomForest를 사용한 결과는 만족 스럽지만 인정합니다.하지만 BayesNet은 저를 괴롭 힙니다. –
전체 데이터가 없으면 무슨 일이 벌어지는 지 말하기 어렵습니다. 이 기능은 좋은 분리를 달성하지 못할 수도 있습니다 (최소한 BayesNet과 관련하여).나는 짧은 대답은이 특정 작업을 위해 BayesNet을 사용하지 않는다고 생각한다. –