트리가 충분히 깊어서 터미널 노드가 선택되기 시작했다면, 제로 이동 "재생"을 수행하고 결과를 역 전파해야한다고 가정했을 것입니다. 그러나 IEEE survey of MCTS methods은 선택 사항이 단계는 "가장 긴급한 확장 가능한 노드"를 찾아야하고 다른 반례는 찾을 수 없습니다. 나는 그들을 어떻게 든 배제해야만 하는가? 여기에서 옳은 일은 무엇입니까?몬테 카를로 트리 검색에서 터미널 노드를 처리하는 방법은 무엇입니까?
0
A
답변
1
실제로 선택 단계에서 터미널 노드에 도달하면 확장 및 재생을 건너 뛰고 (더 이상 의미가 없음) 해당 터미널 노드의 값을 똑같은 방식으로 역 전파하십시오.
연결된 종이에서 6 페이지에서 분명하지 않지만 9 페이지의 알고리즘 2에서 분명합니다.이 의사 코드에서 TreePolicy()
함수는 끝 노드 v를 반환하게됩니다.이 상태 노드가 DefaultPolicy()
함수로 전달되면 해당 함수는 직접 보상을 반환합니다 (해당 함수의 while 루프는 절대로 충족되지 않습니다).
알고리즘을 직관적으로 이해하고 무한한 처리 시간을 고려한 최적의 값 견적을 보장 할 수 있기를 원하는 경우이 작업을 수행하는 것이 좋습니다. 무한한 처리 시간 (무한한 시뮬레이션 횟수)을 사용하면 무한히 자주 "최상의"터미널 상태의 값을 백업해야하므로 루트에 가까운 노드의 백업에서 평균 된 값도 해당 노드로 수렴됩니다. 제한에서 최상의 리프 노드 값.
관련 문제
- 1. 몬테 카를로 통합이
- 2. 몬테 카를로 통합
- 3. Cuda의 몬테 카를로 스윕
- 4. MCNP 몬테 카를로 시뮬레이션을위한 Opensource 대안
- 5. 여러 개의 배열 중에서 하나의 배열을 만듭니다. 몬테 - 카를로 방법
- 6. 몬테 - 카를로 (Monte-Carlo) 방법을 사용하여 n 볼의 볼륨을 계산합니다.
- 7. 몬테 카를로 방법을 사용하여 최저 가격에 이상적인 양자를 찾으십시오.
- 8. 실패 가능성 - 한계 상태 함수 - 몬테 카를로 메서드
- 9. 나는 항상 내가 몬테 - 카를로 시뮬레이션을 실행하는거야 ggplot2
- 10. Parfor 루프에서 스크램블 된 준 몬테 카를로 수 생성 문제
- 11. 오류 pi`가 단위 원에 몬테 카를로 시뮬레이션을 사용하는`추정
- 12. 트리 뷰 노드를 세미콜론으로 처리하는 방법.
- 13. 트리 노드를 선택하면 SN을 보내는 방법은 무엇입니까?
- 14. WPF 트리 뷰에서 노드를 찾는 방법은 무엇입니까?
- 15. 트리 노드를 제거하고 노드 노드를 위쪽으로 이동하는 방법은 무엇입니까?
- 16. 요리사 검색에서 노드를 어떻게 정렬합니까?
- 17. 자식이없는 트리 노드를 접는 방법
- 18. 루프 몬테 카를로 시뮬레이션을 위해 달리기를 할 때 지퍼로 인한 문제; python
- 19. Elastic 검색에서 html 인코딩 된 텍스트를 처리하는 방법은 무엇입니까?
- 20. 트리 검색에서 PLINQ 병목 현상을 이해합니다.
- 21. 트리 뷰에서 노드를 선택하면 별도의 트리 뷰에있는 노드를 선택합니다.
- 22. 노드를 트리 라켓에 삽입
- 23. json 검색에서 'null'값을 처리하는 방법
- 24. 트리 배열을 처리하는 가장 좋은 방법은
- 25. 자바에서 백 스페이스 터미널 제어 문자를 처리하는 방법은 무엇입니까?
- 26. 특정 트리 노드를 트리 뷰에서 폴더로 표시하는 방법
- 27. 몬테 칼로 시뮬레이션을위한 MATLAB 코드
- 28. asp.net에서 런타임에 트리 뷰에 자식 노드를 추가하는 방법은 무엇입니까?
- 29. Ext JS 트리 노드를 올바르게 사용자 정의하는 방법은 무엇입니까?
- 30. 트리 노드를 ZK의 TreeNode 구조에서 선택하는 방법은 무엇입니까?