2017-10-12 1 views
1

내 이해는 Softmax입니다. 회귀는 여러 클래스를 지원하는 로지스틱 회귀의 일반화입니다.다중 클래스를 직접 지원하는 로지스틱 회귀

Softmax 회귀 모델은 먼저 각 클래스의 점수를 계산 한 다음 softmax 함수를 점수에 적용하여 각 클래스의 확률을 계산합니다.

각 클래스는 자체 전용 매개 변수 벡터를 가지고

내 질문 : 왜 우리가 로지스틱 회귀 훨씬 간단한 방법으로 여러 클래스로 분류하는 데 사용할 수 없습니다와 같은 확률이 0이면 다음 클래스 A 0.3; 0.3 ~ 0.6 등급 B : 0.6 ~ 0.9 등급 C 등

왜 개별 계수 벡터가 항상 필요한가?

저는 ML을 처음 사용합니다. 이 질문이 근본적인 개념 이해의 부족 때문인지 확실하지 않습니다.

답변

1

처음에는 전문 용어로는 더 많은 전문 용어가 multinomial logistic regression이라고 말하고 싶습니다.

softmax 함수는 corresponds to MLE이기 때문에 컴퓨팅 확률에 대한 자연 선택입니다. Cross-entropy loss도 마찬가지로 확률 론적 해석을합니다 - 그것은 두 분포 (출력과 목표) 사이의 "거리"입니다. 당신이 제안하는 것은 인공적인 방법으로 클래스를 차별화하는 것입니다 - 바이너리 배포판을 출력하고 어떻게 든 멀티 클래스 배포판과 비교하십시오. 이론 상으로는 가능하고 작동 할 수도 있지만 반드시 단점이 있습니다. 예를 들어, 훈련하기가 더 어렵습니다.

출력이 0.2 (즉, 클래스 A)이고 지상 진실이 클래스 B라고 가정합니다. 네트워크에 더 높은 값으로 이동하도록 알려야합니다. 다음 번에 출력은 0.7입니다. 네트워크가 실제로 학습되어 올바른 방향으로 이동했지만 다시 처벌합니다. 실제로 네트워크가 중요한 것으로 배우기 위해 시간이 필요하다는 불안정한 포인트 (예 : 0.30.6)가 있습니다. 0.29999990.3000001의 두 값은 네트워크에서 거의 구별 할 수 없지만 결과가 맞는지 여부가 결정됩니다.

일반적으로 확률 분포는 더 많은 정보를 제공하기 때문에 항상 직접 차별보다 낫습니다.