0

https://github.com/yenchenlin/DeepLearningFlappyBird/blob/master/deep_q_network.py#L82인기 깊은 Q 학습 프로그램

내가 그것을 이해하기 위해 많은 시간을 보내고있는이 라인을 이해할 수 없습니다.

tf.multiply을 사용해야합니까?

이 곱하기 연산을 지원하는 수학 연산을 찾을 수 없습니다.

+0

이 질문은 https://stats.stackexchange.com/에 더 적합하다고 생각합니다. – PJvG

+0

@PJvG 감사합니다. –

답변

0

모든 동작에는 Q_value가 있습니다.

동작 입력 a은 핫입니다.

이 줄은 '뜨거운'Q_value를 선택하는 것입니다.

관련 문제