자필 자릿수를 인식 할 때 왜 4 뉴런 대신 10 뉴런을 출력 레이어에 사용해야합니까?

neural networks and deep learning에서 chap1을 읽었습니다. "손으로 쓰는 숫자를 분류 할 수있는 간단한 네트워크"(ctrl-f로 검색 할 수 있음)에서 좋은 문제를 발견했습니다. "왜 출력 레이어에 4 개의 뉴런 대신 10 개의 뉴런을 사용해야합니까? 뉴런? "자필 자릿수를 인식 할 때 왜 4 뉴런 대신 10 뉴런을 출력 레이어에 사용해야합니까?

4 개의 뉴런을 사용하면 각 뉴런의 값이 0 또는 1이되어 2^4 = 16> 10을 나타냅니다. 따라서 출력 레이어에 4 개의 뉴런을 사용하지 않는 이유는 무엇입니까?

출처

2016-09-12 Tuan Nguyen Dinh

각 출력 뉴런은 한자리 숫자를 담당합니다. 출력 뉴런 i (총 10 개의 뉴런)은 입력 숫자가 i 인 확률 [0,1)을 반환합니다. 이 방법을 사용하면 비트 단위로 사용할 때 단일 출력 대신 각 숫자에 대한 확률 분포를 알 수 있습니다 (예 : 2^4).

출처

2016-09-12 14:53:58 serhiyb

답장을 보내 주셔서 감사합니다. :) –

@serhiyb이 맞습니다. 가능한 모든 클래스에 대한 로그를 계산하여 교차 엔트로피 손실을 사용할 수 있습니다. 이는 실수를 신뢰도에 비례하여 불의합니다. (즉, 높은 신뢰도를 가진 잘못된 분류는 낮은 신뢰도의 잘못된 분류보다 더 많은 손실을 초래합니다.)이 모델 성능 측정은 정확도보다 낫습니다. – vin

자필 자릿수를 인식 할 때 왜 4 뉴런 대신 10 뉴런을 출력 레이어에 사용해야합니까?

답변

관련 문제