파이썬을 사용하여 바이너리 대상 클래스가있는 불균형 데이터 세트에서 임의의 포리스트를 실행합니다. 리콜과 정확성을 높이기 위해 기본 확률 임계 값 0.5를 다른 값으로 변경하고 싶습니다. 지금까지이 작업을 수행하는 데 사용할 수있는 정의 된 메서드 또는 클래스를 찾을 수 없습니다. 누구든지 조언을 부탁 할 수 있을까요? 아니면 코드를 직접 작성해야합니까? 건배임의의 포리스트에서 내 자신의 확률 임계 값을 설정하는 방법은 무엇입니까?
0
A
답변
1
scikit-learn의 RandomForestClassifier에는 클래스를 샘플에 할당 할 고정 된 임계 값이 없습니다. RandomForestClassifier.predict의 소스 코드에서 볼 수 있듯이 가장 가능성있는 클래스를 반환합니다. 물론 @thiom이 제안한 접근법을 사용할 수는 있지만 정밀도와 리콜을 향상시킬 수 있다고 상상할 수는 없습니다.
예를 들어, 선택한 임계 값이 0.7이고 클래스 확률이 0.6 및 0.4 인 경우 어떤 클래스를 할당합니까? 전혀?
대안으로 RandomForestClassifier의 class_weight
옵션을 사용하여 불충분 한 클래스에 더 많은 가중치를 부여 할 수 있습니다.
+0
동의합니다. 예측 확률을 변경하는 것은 불균형 클래스에 대한 정밀도/리콜을 향상시키는 강력한 방법이 아닙니다. Rene의 제안처럼 클래스 가중치로 연주하거나 샘플링 빈도를 변경하는 것과 같은 모델 교육 전략을 업데이트해야합니다. – tihom
관련 문제
- 1. ffmpeg에서 임의의 픽셀 값을 설정하는 방법은 무엇입니까?
- 2. js에서 임의의 확률 행렬을 만드는 방법은 무엇입니까?
- 3. 임의의 포리스트에서 모델링 한 후 기능을 인쇄하는 방법은 무엇입니까?
- 4. 임의의 포리스트에서 pmml 파일을 파이썬으로 변환
- 5. 임의의 포리스트에서 로그를 사용하는 중 오류가 발생했습니다.
- 6. C++ - 임계 값 확률 분포
- 7. Matlab에서 나무를 탐지하기위한 임계 값을 설정하는 방법은 무엇입니까?
- 8. 아파치 수축 모듈의 파일 크기 임계 값을 설정하는 방법은 무엇입니까?
- 9. 임의의 확률 밀도 함수에서 임의의 숫자 생성
- 10. 랜덤 포리스트에서 가방 오류가 무엇입니까?
- 11. opencv에서 OTSU 임계 값을 사용하는 방법은 무엇입니까?
- 12. 4x4 그리드와 비교하면서 임계 값을 설정하는 방법
- 13. Log4Net : 런타임에 임계 값을 구성하는 방법은 무엇입니까?
- 14. 분류 모델에서 임계 값을 결정하는 방법은 무엇입니까?
- 15. Tensorflow에서 각 클래스의 원시 확률 값을 얻는 방법은 무엇입니까?
- 16. appsettings.json에서 내 자신의 KeyGenerator 인스턴스를 설정하는 방법은 무엇입니까?
- 17. dojo editor fontChoice plugin에 내 값을 설정하는 방법은 무엇입니까?
- 18. 자신의 PEAR 채널을 설정하는 방법은 무엇입니까?
- 19. 확률 가중치 임의의 문자열 생성기
- 20. sklearn을 사용하는 임의의 포리스트에서 자동 하이퍼 매개 변수 조정?
- 21. 임의의 포리스트에서 패키지 'party'의 트리 정보를 얻는 방법
- 22. 내 곡선이 특정 임계 값을 통과
- 23. 값을 내 요소로 설정하는 방법
- 24. open_basedir 값을 설정하는 방법은 무엇입니까?
- 25. selectManyCheckbox 값을 설정하는 방법은 무엇입니까?
- 26. SPFieldDateTime의 값을 설정하는 방법은 무엇입니까?
- 27. 임의의 변수를 모델링하는 방법은 무엇입니까?
- 28. matlab에서 자신의 확률 분포 함수 정의하기
- 29. GridItem 값을 설정하는 방법은 무엇입니까?
- 30. 요소에 값을 설정하는 방법은 무엇입니까?
실행중인 라이브러리는 무엇입니까? 파이썬에는 "임의의 포레스트"가 없습니다. –
@AmiTavory sklearn.ensemble에서 가져온 RandomForestClassifier ' – LUSAQX
을 사용하면'p = clf.predict_proba (X)'를 사용하여 확률을 얻은 다음'Y = p> custom_value' – tihom