얼굴 표정 인식을위한 모델로 (Keras를 통해) 컨볼 루션 신경망을 사용하고 있습니다 (55 명). 내 데이터 세트는 매우 어렵고 450k 약 7 클래스입니다. 나는 각 과목과 등급별로 나의 훈련 세트를 균형 잡았다. 첫 번째 시대 이후에 불복
내가 (실시간 데이터 증가에) 매우 간단한 CNN 아키텍처 구현 : 최초의 획기적인 후model = Sequential()
model.add(Convolution2D(32, 3, 3, border_mode=borderMode, init=initialization, input_shape=(48, 48, 3)))
model.add(BatchNormalization())
model.add(PReLU())
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(256))
model.add(BatchNormalization())
model.add(PReLU())
model.add(Dropout(0.5))
model.add(Dense(nb_output))
model.add(Activation('softmax'))
을 내 훈련 손실은 지속적 동안 검증 손실이 증가를 감소시킨다. overfitting 곧 그 일이있을 수 있을까요? 또는 데이터가 혼동되는 문제가 있습니까? 테스트 세트의 균형을 맞추어야합니까?
지나친 부분이 문제라고 생각하면 지나친 부분을 해결하기 위해 시도 할 수 있습니다 (예 : 데이터 증가 (https://keras.io/preprocessing/image/), 더 많은 드롭 아웃, 더 간단한 넷 아키텍처 등이 있습니다. –