강의 앤드류 응 상기있다로지스틱 회귀 : 바이어스 및 tensorflow의 비용 함수
J = -1/m의 * 합 (y를 * 로그 (H (X)) + (1-γ) 로그 (1 그 -h (X)))
하지만 https://www.tensorflow.org/get_started/mnist/beginners에서
그들은 주 :왜 그들이이 공식을 사용 했 ?
강의 앤드류 응 상기있다로지스틱 회귀 : 바이어스 및 tensorflow의 비용 함수
J = -1/m의 * 합 (y를 * 로그 (H (X)) + (1-γ) 로그 (1 그 -h (X)))
하지만 https://www.tensorflow.org/get_started/mnist/beginners에서
그들은 주 :왜 그들이이 공식을 사용 했 ?
이진수와 범주 형 접근 방식입니다. Andrew Ng 비용 함수는 binary crossropropy (또는 logloss)이며, tensorflow 튜토리얼에서 사용되는 비용 함수는 범주 적 crossropropy입니다. 그들은 하나의 핫 벡터 인코딩을 사용하여이 여러 카테고리에 걸쳐 사용합니다. 그래서 2 카테고리의 경우에도 이와 같은 라벨이 있습니다 : [0, 1].
이진수의 경우 0은 대소 문자의 레이블입니다. 어쨌든 모든 요소가 1로 합쳐져야하는 softmax 분류 자 때문에 1 개의 문제 만있는 범주적인 경우에는 존재하지 않습니다.
그러나 어떤 방법이 가장 좋습니까? –
데이터에 따라 다릅니다. 바이너리 교차 엔트로피는 2 개의 클래스 문제에만 사용할 수있는 반면, 범주 적 문제는 멀티 클래스 문제에 사용됩니다. –
범주 형 접근법에 대한 정보는 어디서 얻을 수 있습니까? –
이것은 수학에 관한 것으로 보이지만 파이썬에 관한 것은 아닙니다. – khelwood