2011-03-21 4 views
0

connect-4에 대해 일부 AI를 코딩했습니다. 특정 평가 함수에서 가중치를 조정하고 싶습니다. 시간과 하드웨어가 제한되어 있으므로 제 질문은 다음과 같습니다. 낮은 깊이의 검색을 사용하여 얻은 결과를 기반으로 "교육"을 수행하고 가중치를 조정하는 평가의 품질 측면에서 매우 어려울까요? 인공 지능은 나중에 더 많은 시간을 갖고 더 깊은 레벨에서 게임 트리를 검색 할 수있는 상황에서 최선을 다해야합니까?평가 함수의 가중치 조정

+0

"일부 인공 지능"으로, 당신은 minimax 알고리즘을 의미한다고 생각하십니까? –

+0

예 죄송합니다. Alpha-Beta 가지 치기 기능이있는 MiniMAx는 이전 심도의 평가 값 이후에 반복적으로 심화되고 순서가 바뀝니다. – Mbentt

+0

평가 기능이 어떻게 작동하고 "가중치"가 무엇인지 자세히 설명해주십시오. "훈련"이란 무엇을 의미합니까? –

답변

1

제한된 시간이있는 경우 낮은 심도 검색을 사용하여 가중치를 조정해야합니다. 이것은 주사위 놀이와 같은 게임을 만드는 데 사용되는 시간차 학습이라는 개념과 매우 유사합니다. 즉, 강화 학습이라는 아이디어를 사용하고자 할 수 있습니다. 시간적 차이는 강화 학습의 취향입니다.