2

이 질문을하는 내 동기는 그래프 데이터 세트에서 기계 학습을 사용하여 흥미로운 문제를 발견했다는 것입니다. 이 주제에 대한 논문이 있습니다. 예를 들어, "지시 된 그래프의 레이블 및 레이블없는 데이터로부터 학습"(Zhou, Huang, Scholkopf). 그러나 저는 인공 지능이나 기계 학습에 대한 배경 지식이 없으므로 좀 더 일반적인 청중을위한 작은 프로그램을 작성하여 과학적으로 작업하고 싶습니다.기계 학습을 사용하여 퍼즐 게임 AI 개선

몇 년 전에 저는 Solumns 게임을 썼습니다. 그것은 고전적인 Sega 게임 칼럼의 악의 변형입니다. bastet에서 영감을 얻은이 게임은 플레이어에게 불리한 색상 조합을 자랑합니다. 그것은 어렵다.

저는 AI를 개선하고 싶습니다. 게임 공간 (색칠 된 블록, 열 위치, 열 색의 격자)이 특성 목록보다 그래프 구조에 더 적합하다는 것을 알았습니다. 그렇다면이 문제는 제 연구 문제와 유사합니다. 나는이 문제를 해결하기 위해 다음과 같은 높은 수준의 계획을 사용하여 고려하고

: 인공 지능 상대가 더에 따라 가능한 이동에 피트니스 등급을 할당 할 수있는 경우

  1. 내가 도움이 될 것입니다 무슨 생각하고있다 데이터는 이동 후 보드에있는 기존 사각형의 수보다 큽니다. 나는 categoriser를 사용하여 생각하고있다. 성공의 척도로서 게임의 나머지 과정을 사용하여 이동 및 모든 과거 이동을 훈련하십시오.
  2. 표준 AI 상대를 이길 수있는 플레이어 봇을 개발할 생각입니다. 이것은 1에 대한 데이터를 생성 할 때 유용 할 수 있습니다.
  3. 플레이어의 봇의 게임 샘플을 사용하여 전략적 플레이어보다 뛰는 AI를 만듭니다. 어쩌면이 데이터를 1로 사용할 수도 있습니다.
  4. 1, 3의 가능한 조합과 가능한 경우 원래의 AI에 위임 한 재미있는 AI를 작성하여 경험적 퍼지 요소를 찾는 실험을 통해 결정합니다.

플레이어 봇을 빌드하려면 무차별 대항력을 사용하여 샘플 공간을 계산할 수 있다고 생각했습니다. 그런 다음 랜덤 포리스트를 만드는 데 사용되는 것과 같은 기계 학습 기술을 사용하여 일종의 의사 결정자를 만듭니다.

인공 지능 상대 빌드는 내가 가장 당황한 곳입니다. 다음

구체적인 질문 :

  • 평가 이동하는 사람들이 체스와 함께 할 물건의 종류 같은데, 나는 무지있을 수 있습니다 내 접근 방식을 인정한다하더라도,이 문헌에서 이에 대한 많은 내가 할 수있는 그것으로부터 배워라. 질문 : 플레이어 봇과 AI 상대방이 데이터 샘플을 생성해야합니까? 여러 샘플 세트 사이에서 혼란스러워하는 것처럼 들리지만 나쁜 훈련을위한 처방처럼 들립니다. 방금 게임을해야할까요?
  • 현재 AI와 비교하여 플레이어 봇을 훈련시키기 위해 어떤 종류의 알고리즘을 고려해야합니까?
  • 플레이어 봇과 AI 상대방을 훈련시키기 위해 어떤 알고리즘을 고려해야합니까?

추가 정보 :이 전략 게임 인공 지능 프로그래밍에 적합한 경우

  • 나는 의도적으로 요구하고 있지 않다.물론, 위대한 인공 지능을 더 간단하게 작성할 수 있습니다 (결국은 입니다. 연주하기 어렵습니다). 나는 재미있는 일을함으로써 기계 학습에 대해 배우고 싶다.
  • 원래 게임은 라켓과 C.의 혼합으로 작성되었습니다. 여러 가지 이유로 jruby에 이식 할 예정이며, 다른 빠른 언어로 확장 또는 RPC 호출을 할 가능성이 있습니다. 나는 기존의 언어 별 솔루션에별로 관심이 없다. 나는이 분야에서 기술을 발전시키고 싶고 스스로 알고리즘을 구현하는 것을 두려워하지 않는다.

당신은 내가 기계가 여기에 학습을위한 갈 것 original game here

+0

여기에 물어보기 좋은 질문이 아닙니다. 너무 광범위합니다. 더 구체적인 하위 문제로 질문을 세분화 할 수 있습니까? 그렇게하면 대답을 얻는 것이 더 쉬울 것입니다. – greeness

+0

해야 할 일. 고맙습니다. 나는 더 많은 일을하고 있으며 구체적으로 돌아올 것이다. –

답변

0

의 소스를 얻을 수 있습니다. 인공 지능을 재생하는 게임을보십시오.

당신은 두 개의 비대칭 플레이어 (이동 등) 적대 게임이 있습니다

  • 조각을 배치하는 사용자,
  • 과 (대신 우연히 조각을 선택하는) 조각을 선택하는 컴퓨터.

몬테카를로 트리 검색부터 시작합니다.

+0

예 - 샘플 생성을 쉽게하기 위해 대칭적인 접근으로 옮겼습니다. –

관련 문제