편집 :신경 네트워크
더 날카로운 질문 : 는이 softmax의 유도체는 내 그라데이션 하강 무엇을 사용할 수 있나요? 그래서 기다려주십시오 :
내가하는 과정에서 현재입니다
는이 과정에 대한 더 많거나 적은 연구 프로젝트이며, NN에 대한 이해는 아주/매우 제한되어 입력 데이터 집합을 검사하고 각 분류의 확률/가능성 (5 가지 분류가 있음)을 출력하려고하는 신경망을 구축합니다. 당연히 모든 출력 노드의 합계가 1이되어야합니다.
현재 두 개의 레이어가 있으며 숨겨진 레이어를 10 개의 노드로 설정합니다.
나는 구현
의 두 가지 종류를 내놓았다-
출력 활성화를 내가 사용하고 모두 숨겨진 레이어 및 출력 활성화
에 대한
softmax'(x) = softmax(x) - softmax(x)^2
을 얻었습니다 (크기 n의 열 벡터를 반환 함).). 나는 또한 MATLAB NN 툴킷을 살펴 보았습니다. 툴킷에서 제공하는 softmax의 파생물은 크기 nxn의 정사각형 매트릭스를 반환했습니다. 대각선은 손으로 계산 한 softmax '(x)와 일치합니다. 출력 행렬을 해석하는 방법을 모르겠습니다. 각 구현을 학습 전파 속도 0.001과 1000 회 반복 전파로 실행했습니다. 그러나 내 NN은 입력 데이터 집합의 모든 하위 집합에 대해 5 개의 출력 노드 모두에 대해 0.2 (균등 한 분포)를 반환합니다.
내 결론은 :
- 나는 하강의 내 그라데이션이 잘못 수행되는 것을 상당히 확신하지만, 나는이 문제를 해결하는 방법을 모른다.
- 아마도 내가 사용하고 있지 않다 충분한 숨겨진 노드
- 는 아마도 내가 어떤 도움을 크게 감상 할 수
층
나는 더 많은 지적 된 질문을 내 게시물 상단에 추가했습니다. 교수님 께 도움을 청하는 시도를했지만, 그에게서 소식을 듣지 못했습니다. 이것은 물론 코스의 범위를 벗어납니다. – Cambium
내 코드에서 어리석은 실수가 있었지만 내 softmax 파생 상품이 잘못되었다는 생각에 너무 집중했습니다. Arg! – Cambium