4

내가 아는 한 NEAT (신경 증식 토폴로지)는 진화의 개념을 사용하여 신경망을 학습하는 알고리즘입니다. 다른 한편, 보강 학습은보다 성공적인 노드에 "보람"을주는 개념으로 기계 학습의 한 유형입니다.NEAT vs Reinforcement Learning

두 필드의 차이점은 무엇입니까? 아니면 NEAT가 강화 학습에서 파생 되었습니까?

답변

5

요컨대 그들은 거의 공통점이 없습니다.

NEAT는 진화 방법이다. 이것은 기능 최적화에 대한 블랙 박스 접근법입니다. 이 경우 - 쉽게 측정 할 수있는 신경망의 성능. (진화하는 동안 당신이 바꾸는) 아키텍처로.

강화 학습은 에이전트가 환경에서 잘 작동하는 학습 정책에 관한 것입니다. 따라서 그들은 다른, 더 복잡한 문제를 해결합니다. 이론적으로 당신은 RL을 사용하여 NEAT를 배울 수 있습니다. "신경망을 주면 시간이 지남에 따라 더 나은 성능을 얻는 방법을 배웁니다"라는 문제를 제기 할 수 있습니다. 결정적인 차이점은 - NEAT 출력은 네트워크, RL 출력은 정책, 전략, 알고리즘입니다. 어떤 환경에서 일하기 위해 여러 번 사용할 수있는 뭔가가 행동을 취하고 보상을 얻습니다.

+1

두 접근법은 매우 다르며 일반적으로 다른 상황에서 사용됩니다. 그러나 강화 학습이 반드시 더 복잡한 "문제를 해결하는 것은 아닙니다 (예 : https://arxiv.org/pdf/1703.03864.pdf 참조) – Pablo