나는 정책 반복 방법을 사용하여 거들 세계를 해결하는 방법을 안다. 일반적인 환경을 어떻게 해결할 수 있습니까? 내 데이터는 다음과 같이이다 :정책 반복을 사용하여 Java의 일반 환경 에이전트를 해결하는 방법?
이 내 데이터의 일부가 전환 모델을 설명, 소스 및 대상 유형이 문자열을 언급 나는 그리드 세계를 만들려하지 마십시오.
내 상태를 정의하는 방법과이를 가져 오는 방법을 알지 못합니다. 벡터를 사용하여 저장할 수 있습니까? 그것들을 정의하는 방법이 첫 번째 문제입니다.
파란색 단어를 클릭하면 내 데이터 이미지가 표시됩니다. 감사. –