1

백 프로게션은 패턴 당 가중치 당 dW (weight delta)을 계산하므로 확률 론적 훈련을 수행 할 때 쉽게 가중치를 수정하는 방법입니다. 하지만 배치 교육에 어떻게 사용합니까? 전체 트레이닝 세트에 dW을 축적 한 다음 수정을 적용하거나 더 많은 정보가 있습니까?백 프로덕션 및 일괄 처리

답변

0

예, 전체 교육 세트에 dW 만 누적하십시오. 적어도 그것이 제가 대학원에 다시 코딩 한 방법입니다 ...

+1

하지만 입력 가중치를 다시 계산할 때 (?) 입력 벡터를 사용해야합니다. 그래서, 내가 2 개의 벡터에 대한 오차를 누적했다면, 나는 backprop을하기 시작합니다 - 어떤 벡터를 선택합니까? 하나의 벡터로 백 드롭을 실행하고 모든 가중치를 업데이트 한 다음 다른 벡터로 백 드롭을 실행하여 모든 가중치를 다시 업데이트합니까? – dwanderson

+0

@ dwanderson이 작업을 수행하는 방법을 결정 했습니까? 나는 너와 같은 장소에 머물러있어 전체 배치에 걸쳐 모든 델타를 축적했지만 여기에서 어떻게 진행해야할지 모르겠다. 내 가정은 델타를 평균 델타로 설정 한 다음 데이터 세트의 각 벡터에 대한 가중치를 업데이트하는 것입니다. –

2

다른 샘플의 다른 그라디언트로 많은 것을 할 수 있습니다. 그게 더 높은 순서 정보 (근사 2 차 미분) 또는 공액 그라디언트 또는 자연 그라디언트 또는 ... 포함 : ...