0

나는 state-> action 쌍 (s, a)의 데이터 세트를 가지고있다. 여기서 각 s는 가능한 선택 사항에 대한 확률 분포를 정의하고, 각 a는 확률 분포로부터 샘플링된다. 나는이 데이터 세트에 대한 분류자를 훈련시키고 싶다. 최대 가능성을 예측하는 것을 배우기보다는, 분포 a가 샘플링 된 것으로 예측한다.scikit으로 학습 확률 분포가 무작위 포리스트를 학습합니까?

예를 들어 반복 가위 - 가위를 연주하는 경우 상태는 이전에 만든 이동과 ∈ {바위, 종이, 가위} 일 수 있습니다. 이전 상태는 선택 확률을 줄입니다. 그 행동을 다시 내 데이터 세트는 다음과 같습니다.

PreviousAction,Chosen 
Rock,Paper 
Paper,Rock 
Rock,Scissors 
Scissors,Paper 
Paper,Paper 
... 

scikit-learn에서 임의의 포리스트가있는 레이블에 대한 확률 분포를 학습 할 수 있습니까?

답변

1

예, 그렇습니다. fit (y 인수로 확률 분포가 아닌 레이블이 필요함)을 사용하여 RandomForestClassifier을 교육 한 다음 predict_proba을 사용하여 예측하십시오.