2017-10-20 1 views
1

나는 사용자의 감정을 기반으로 이미지를 분류 할 수있는 cnn 모델 (keras)을 작성하려고합니다. 데이터 관련 문제가 있습니다. 나는 훈련을 위해 실제로 작은 데이터를 가지고있다. 데이터를 보강하면 도움이 될까요? 그것은 정확도를 향상 시키는가? 어떤 경우에는 데이터를 보강하도록 선택해야하며 피해야합니까?이미지 확대 기능이 도움이됩니까?

답변

2

데이터를 늘리면 도움이 될까요? 그것은 정확도를 향상 시키는가?

사전에 말하기 어렵습니다. 그러나 거의 확실하게, 당신이 이미 무작위보다는 더 나은 모델을 가지고있을 때. 그리고 당신이 올바른 증강 방법을 선택할 때.

많은 다른 기능 보강 방법에 대해서는 내 마스터 논문 Analysis and Optimization of Convolutional Neural Network Architectures, 80 페이지를 참조하십시오.

어떤 경우에는 데이터를 보강해야하며 피해야합니까? 충분한 데이터가없는 경우

  • ->
  • 당신이 확대 후 감정을 말할 수 없다 보강을 피 증대. 그래서 문자 인식의 경우, 회전 (예를 들면 인해 6 vs 9 또는 u vs n 또는 \rightarrow vs \nearrow에) 나쁜 생각이다
+0

감사합니다. – Afrid

2

예, 데이터 증가가 실제로 도움이되며 때로는 필수적입니다. (그러나 Martin Thoma의 대답을 살펴보면 자세한 내용과 중요한 "take-cares"가 있습니다.) 때

당신은 그것을 사용해야한다 : 당신은 너무 적은 데이터가

  • 당신은 당신의 모델이 너무 쉽게 overfitting되어 알
  • 가 (너무 너무 강력한 모델이 될 수 있음)

Overfitting은 뭔가 이는 모델이 데이터를 기억할 수있을 때 발생합니다. 그런 다음 교육 데이터에 대해서는 훌륭한 정확도를 갖지만 테스트 데이터에 대해서는 정확도가 떨어집니다.

교육 데이터의 크기를 늘리면 모델을 기억하는 것이 더 어려워집니다. 여기 저기에 작은 변화가 일어나면 모델이 더 이상 의미가없는 (그러나 이미지를 구분할 수있는) 세부 사항에주의를 기울이면서 실제로 원하는 효과를 발생시키는 세부 사항에주의를 기울이십시오.

+0

확대에 충분하다 또는 우리는 또한 채널과 히스토그램 평활화 함께 놀러 수있는 크기 조정 및 회전, 확대합니까? – Afrid

+1

일부 기능 보강을 시도하지 않고도 충분하다고 말할 수는 없습니다. 더 흥미로운 질문은 그들이 모델을 전혀 개선하지 않는다는 것입니다. 그리고 그것은 또한 매우 문제입니다. 모델과 데이터 셋은 구체적입니다. (+1은 +1입니다.) –

+0

실제로 @MartinThoma. –