기계 학습을 사용하여 퍼즐 게임 AI 개선

이 질문을하는 내 동기는 그래프 데이터 세트에서 기계 학습을 사용하여 흥미로운 문제를 발견했다는 것입니다. 이 주제에 대한 논문이 있습니다. 예를 들어, "지시 된 그래프의 레이블 및 레이블없는 데이터로부터 학습"(Zhou, Huang, Scholkopf). 그러나 저는 인공 지능이나 기계 학습에 대한 배경 지식이 없으므로 좀 더 일반적인 청중을위한 작은 프로그램을 작성하여 과학적으로 작업하고 싶습니다.기계 학습을 사용하여 퍼즐 게임 AI 개선

몇 년 전에 저는 Solumns 게임을 썼습니다. 그것은 고전적인 Sega 게임 칼럼의 악의 변형입니다. bastet에서 영감을 얻은이 게임은 플레이어에게 불리한 색상 조합을 자랑합니다. 그것은 어렵다.

저는 AI를 개선하고 싶습니다. 게임 공간 (색칠 된 블록, 열 위치, 열 색의 격자)이 특성 목록보다 그래프 구조에 더 적합하다는 것을 알았습니다. 그렇다면이 문제는 제 연구 문제와 유사합니다. 나는이 문제를 해결하기 위해 다음과 같은 높은 수준의 계획을 사용하여 고려하고

: 인공 지능 상대가 더에 따라 가능한 이동에 피트니스 등급을 할당 할 수있는 경우

내가 도움이 될 것입니다 무슨 생각하고있다 데이터는 이동 후 보드에있는 기존 사각형의 수보다 큽니다. 나는 categoriser를 사용하여 생각하고있다. 성공의 척도로서 게임의 나머지 과정을 사용하여 이동 및 모든 과거 이동을 훈련하십시오.
표준 AI 상대를 이길 수있는 플레이어 봇을 개발할 생각입니다. 이것은 1에 대한 데이터를 생성 할 때 유용 할 수 있습니다.
플레이어의 봇의 게임 샘플을 사용하여 전략적 플레이어보다 뛰는 AI를 만듭니다. 어쩌면이 데이터를 1로 사용할 수도 있습니다.
1, 3의 가능한 조합과 가능한 경우 원래의 AI에 위임 한 재미있는 AI를 작성하여 경험적 퍼지 요소를 찾는 실험을 통해 결정합니다.

플레이어 봇을 빌드하려면 무차별 대항력을 사용하여 샘플 공간을 계산할 수 있다고 생각했습니다. 그런 다음 랜덤 포리스트를 만드는 데 사용되는 것과 같은 기계 학습 기술을 사용하여 일종의 의사 결정자를 만듭니다.

인공 지능 상대 빌드는 내가 가장 당황한 곳입니다. 다음

구체적인 질문 :

평가 이동하는 사람들이 체스와 함께 할 물건의 종류 같은데, 나는 무지있을 수 있습니다 내 접근 방식을 인정한다하더라도,이 문헌에서 이에 대한 많은 내가 할 수있는 그것으로부터 배워라. 질문 : 플레이어 봇과 AI 상대방이 데이터 샘플을 생성해야합니까? 여러 샘플 세트 사이에서 혼란스러워하는 것처럼 들리지만 나쁜 훈련을위한 처방처럼 들립니다. 방금 게임을해야할까요?
현재 AI와 비교하여 플레이어 봇을 훈련시키기 위해 어떤 종류의 알고리즘을 고려해야합니까?
플레이어 봇과 AI 상대방을 훈련시키기 위해 어떤 알고리즘을 고려해야합니까?

추가 정보 :이 전략 게임 인공 지능 프로그래밍에 적합한 경우

나는 의도적으로 요구하고 있지 않다.물론, 위대한 인공 지능을 더 간단하게 작성할 수 있습니다 (결국은 입니다. 연주하기 어렵습니다). 나는 재미있는 일을함으로써 기계 학습에 대해 배우고 싶다.
원래 게임은 라켓과 C.의 혼합으로 작성되었습니다. 여러 가지 이유로 jruby에 이식 할 예정이며, 다른 빠른 언어로 확장 또는 RPC 호출을 할 가능성이 있습니다. 나는 기존의 언어 별 솔루션에별로 관심이 없다. 나는이 분야에서 기술을 발전시키고 싶고 스스로 알고리즘을 구현하는 것을 두려워하지 않는다.

당신은 내가 기계가 여기에 학습을위한 갈 것 original game here

출처

2014-10-03 Moray Jaundice

여기에 물어보기 좋은 질문이 아닙니다. 너무 광범위합니다. 더 구체적인 하위 문제로 질문을 세분화 할 수 있습니까? 그렇게하면 대답을 얻는 것이 더 쉬울 것입니다. – greeness

해야 할 일. 고맙습니다. 나는 더 많은 일을하고 있으며 구체적으로 돌아올 것이다. –

의 소스를 얻을 수 있습니다. 인공 지능을 재생하는 게임을보십시오.

당신은 두 개의 비대칭 플레이어 (이동 등) 적대 게임이 있습니다

조각을 배치하는 사용자,
과 (대신 우연히 조각을 선택하는) 조각을 선택하는 컴퓨터.

몬테카를로 트리 검색부터 시작합니다.

출처

2014-10-17 14:52:24 ziggystar

예 - 샘플 생성을 쉽게하기 위해 대칭적인 접근으로 옮겼습니다. –

기계 학습을 사용하여 퍼즐 게임 AI 개선

답변

관련 문제