1
나는 tensorflow의 최신 버전입니다. cnn을 사용하여 데이터를 학습 할 때 첫 번째 배치에서 "훈련 중 NaN 손실"이 발생하는 경우가 있습니다.Tensorflow CNN 모델에서 "교육 중 NaN 손실"오류가 발생합니다.
> loss function is L1-norm
>
> GradientDescentOptimizer is used.
"bach_size", "learning_rate"= 0 인 경우에도 사용된다 learning_rate 조정된다.
정말 혼란 스러웠던 것은 모든 매개 변수가 고정되었을 때 결과가 때때로 정상적으로 실행될 수 있으며, 때로는 처음 배치에서 "Nan"오류가 발생합니다. 어떻게되는지 알고 싶습니까? 어떤 요인이 결과로 이어질까요? 데이터의 낭에 대한
환영을 제공합니다. 여기서 자원 봉사자가 문제를 진단하는 가장 좋은 방법은 문제를 재현하려는 것입니다. 작고 자립적이며 재현 가능한 예를 제공함으로써이 질문을 개선하십시오. 너무 많은 추측 일뿐입니다. –
글쎄, 우리는 당신의 코드를 가지고 있지 않기 때문에 확실히 말하기 어렵다. 그러나 대부분의 경우 신경망을 훈련 할 때 많은 무작위 요소가 있습니다. 교육 데이터가 섞여 있습니다. 초기 가중치는 일종의 분포에서 무작위로 선택됩니다. 손실 함수에서 가끔 NaN을 얻는 것은 큰 문제는 아니지만 손실 함수가 데이터 나 네트워크와 잘 맞지 않는다는 것을 나타낼 수 있습니다. –
Thks @ MadWombat ~이 문제에 공통적으로 영향을 줄 수있는 요인에 대한 유용한 정보를 제공합니다. – judyzha