Keras를 사용하면 사용자 정의 람다 함수를 계산하는 레이어를 추가 할 수 있습니다. Keras가 backpropagation에 대한이 사용자 정의 함수의 그래디언트를 계산하는 방법을 알지 못합니다.keras (또는 다른 ML 프레임 워크)는 backpropagation을 위해 λ 함수 레이어의 그래디언트를 어떻게 계산합니까?
답변
Theano/Tensorflow 및 라이브러리를 사용하면 얻을 수있는 이점 중 하나가 위에 추가됩니다. 그들은 수학 함수 및 연산의 자동 그라데이션 계산을 제공 할 수 있습니다.
Keras는 호출하여 얻을 : 모든 params
에 대한 업데이트 규칙을 작성하는 데 사용되는 그라디언트를 얻기 위해 옵티 마이저에 의해 호출 차례 (keras/optimizers.py) grads = self.get_gradients(loss, params)
에
# keras/theano_backend.py
def gradients(loss, variables):
return T.grad(loss, variables)
# keras/tensorflow_backend.py
def gradients(loss, variables):
'''Returns the gradients of `variables` (list of tensor variables)
with regard to `loss`.
'''
return tf.gradients(loss, variables, colocate_gradients_with_ops=True)
. 여기서 params
은 계층의 학습 가능한 가중치입니다. 그러나 람다 기능 레이어에 의해 생성 된 레이어에는 학습 가능한 가중치가 없습니다. 그러나 이들은 순방향 prob를 통해 손실 함수에 영향을 미치므로 간접적으로 다른 계층의 훈련 가능한 가중치 그라디언트 계산에 영향을 미칩니다.
새로운 기본 수학 연산/함수를 정의 할 때만 새로운 그래디언트 계산을 작성해야합니다. 또한 사용자 정의 손실 함수를 작성할 때 자동 grad은 거의 항상 그라데이션 계산을 처리합니다. 그러나 사용자 지정 함수의 분석적 그래디언트를 구현하는 경우 선택적으로 (항상은 아니지만) 학습을 최적화 할 수 있습니다. 예를 들어, softwax 함수는 exp, sum 및 div로 표현할 수 있으며 자동 grad은이를 처리 할 수 있지만 분석/기호 grad은 일반적으로 Theano/Tensorflow에서 구현됩니다.
새로운 비밀 작전을 구현하기 위해 당신은 그것에 대해 아래의 링크를 볼 수 있습니다 http://deeplearning.net/software/theano/extending/extending_theano.html https://www.tensorflow.org/versions/r0.12/how_tos/adding_an_op/index.html
을- 1. Keras 레이어의 너비 어레이
- 2. 다른 레이어의 함수 호출
- 3. Keras 모델/레이어의 출력을 얻으려면
- 4. GUI 프레임 워크는 어떻게 작동합니까?
- 5. CSS 프레임 워크는 어떻게 사용됩니까?
- 6. 조롱 프레임 워크는 어떻게 작동합니까?
- 7. R에 벡터 필드를 그리는 행렬의 그래디언트를 어떻게 계산합니까?
- 8. 배열에 λ 함수 할당
- 9. 스크롤의 프레임 속도는 어떻게 계산합니까?
- 10. 다른 레이어의 다른 iframe에서 함수 호출
- 11. 하위 함수 ml
- 12. 표준 ML 재귀 함수
- 13. 프레임 워크는
- 14. kohana 프레임 워크는 무엇을 위해 사용됩니까?
- 15. 콜 스택 (callstack) 프레임 수는 어떻게 계산합니까?
- 16. Keras, 각 레이어의 출력을 얻는 방법?
- 17. Keras - 훈련 된 레이어의 무게를 얻습니다.
- 18. Keras Autoencoders - 숨겨진 레이어의 값을 시각화하는 방법?
- 19. Django 프레임 워크는 어떻게 뒤에서 작동합니까?
- 20. 어떻게 중첩 된 부하에 엔티티 프레임 워크는
- 21. 엔티티 프레임 워크는 내가 BLL 또는 DAL
- 22. 엔티티 프레임 워크는
- 23. 백그라운드에서 PHP와 자체 프레임 워크는 어떻게 작동합니까?
- 24. ML 함수 쓰기
- 25. 커뮤니티 프레임 워크는 PHP
- 26. 엔티티 프레임 워크는 T4
- 27. 표준 ML 함수 설명
- 28. 스칼라를위한 "스펙"BDD 프레임 워크는 어떻게 작동합니까?
- 29. backpropagation을 사용하여 신경망을 훈련시키기 위해 데이터를 셔플해야합니까?
- 30. 엔티티 프레임 워크는