이진 분류 네트워크에서 출력 단위 및 손실 함수의 수

이진 분류 작업이 있다고 가정 해 봅시다.이 작업을 수행 할 신경망을 작성합니다. 두 가지 프레임 워크가 있습니다. 첫 번째는 네트워크가 클래스 중 하나에 속할 가능성을 나타내는 하나의 출력 단위를 가지므로 이진 교차 엔트로피를 사용하여 손실을 계산할 수 있으며, 두 번째 네트워크는 두 가지입니다 출력 단위는 두 클래스에 속한 확률을 나눠서 나타내며, softmax 교차 엔트로피를 사용하여 손실을 계산할 수도 있습니다. 첫 번째 옵션을 사용하라는 제안이 있습니다. 두 가지 옵션의 장점과 단점은 무엇이며, 두 번째 프레임 워크를 선택하면 가장 어려운 문제는 무엇입니까? 누구든지이 사실을 나에게 자세히 설명 할 수 있습니까? 미리 감사드립니다.이진 분류 네트워크에서 출력 단위 및 손실 함수의 수

출처

2017-11-27 Schaffer

하나의 출력 장치를 사용하는 경우 엄격하게 두 클래스 중 하나를 선택한다는 것을 이해해야합니다. 확률이 충분히 높으면 네트워크가 클래스 A를 선택합니다. 그렇지 않으면 클래스 B를 선택합니다. 출력 유닛이 두 개인 경우 네트워크가 두 유닛 모두 낮은 확률로 생성 될 수 있으므로 A 나 B로 끝나지 않게됩니다. 네트워크를 통해 모델링하려는 실제 시스템이 무엇인지에 따라 이러한 두 가지 접근 방식 중 하나입니다.

출처

2017-11-27 15:09:51

답장을 보내 주셔서 감사합니다. @Alexey R. 저는 귀하의 요지를 이해하지 못합니다. 네트워크에도 y = [x1, x2]와 같은 2 개의 출력 단위가 있습니다.이 함수에 softmax 함수를 적용하여 확률을 구할 수 있습니다. 네트워크가 낮은 확률로 생성한다는 의미가 항상 사실이 아닙니다. 두 출력이 크게 다른 경우 한 클래스의 상대적으로 높은 확률을 얻을 수 있습니다. – Schaffer

그렇습니다.하지만 둘 다 낮 으면 어떻게 처리할까요? 하나의 출력 장치 네트워크에서는 이러한 문제가 발생하지 않습니다. –

이 상황에서는 네트워크가 클래스를 예측할 수 없다는 것을 나타냅니다. 이는 대략 0.5를 출력 할 때 하나의 출력 장치가있는 네트워크와 같습니다. – Schaffer

이진 분류 네트워크에서 출력 단위 및 손실 함수의 수

답변

관련 문제