1

나는 tensorflow의 최신 버전입니다. cnn을 사용하여 데이터를 학습 할 때 첫 번째 배치에서 "훈련 중 NaN 손실"이 발생하는 경우가 있습니다.Tensorflow CNN 모델에서 "교육 중 NaN 손실"오류가 발생합니다.

> loss function is L1-norm 
> 
> GradientDescentOptimizer is used. 

"bach_size", "learning_rate"= 0 인 경우에도 사용된다 learning_rate 조정된다.

정말 혼란 스러웠던 것은 모든 매개 변수가 고정되었을 때 결과가 때때로 정상적으로 실행될 수 있으며, 때로는 처음 배치에서 "Nan"오류가 발생합니다. 어떻게되는지 알고 싶습니까? 어떤 요인이 결과로 이어질까요? 데이터의 낭에 대한

+0

환영을 제공합니다. 여기서 자원 봉사자가 문제를 진단하는 가장 좋은 방법은 문제를 재현하려는 것입니다. 작고 자립적이며 재현 가능한 예를 제공함으로써이 질문을 개선하십시오. 너무 많은 추측 일뿐입니다. –

+0

글쎄, 우리는 당신의 코드를 가지고 있지 않기 때문에 확실히 말하기 어렵다. 그러나 대부분의 경우 신경망을 훈련 할 때 많은 무작위 요소가 있습니다. 교육 데이터가 섞여 있습니다. 초기 가중치는 일종의 분포에서 무작위로 선택됩니다. 손실 함수에서 가끔 NaN을 얻는 것은 큰 문제는 아니지만 손실 함수가 데이터 나 네트워크와 잘 맞지 않는다는 것을 나타낼 수 있습니다. –

+0

Thks @ MadWombat ~이 문제에 공통적으로 영향을 줄 수있는 요인에 대한 유용한 정보를 제공합니다. – judyzha

답변

1
  • 점검
  • RELU 활성화는 때때로 유래하는 낭
관련 문제