2016-06-16 1 views
1

초보자이며 mnist 자습서를 이해했습니다. 이제 SVHN 데이터 세트에서 뭔가를 얻고 싶습니다. mnist와는 달리 3 개의 컬러 채널이 제공됩니다. 나는 회선 및 풀링이 색상 채널의 추가 차원으로 어떻게 작동하는지 시각화하는 데 어려움을 겪고 있습니다.3 색 채널로 이미지의 회선/풀링을 상상하는 방법

나에게 좋은 방법이나 링크가 있습니까?

내가 모든 입력 :

답변

2

이 매우 간단합니다, 차이 만 첫 번째 회선에 자리 잡고 감사 : 회색 이미지의

  • 를 입력 모양 ([batch_size, W, H, 1] 그래서 첫 번째 회선입니다 32x 크기를 원한다면 3x3)에 모양이 [3, 3, 1, 32] 인 필터가 있다고 가정 해 보겠습니다.
  • RGB 이미지의 경우 입력 모양은 [batch_size, W, H, 3]이므로 첫 번째 회선 (여전히 3x3)에는 모양이 [3, 3, 3, 32] 인 필터가 있습니다. 두 경우 모두

, (보폭 1) 출력 형태는 [batch_size, W, H, 32]

+0

대단히 감사합니다! 3 색 채널을 가지고있을 때 단색 이미지에 대해 더 많은 수의 커널을 선택해야한다는 것을 의미합니까? (3 색으로 생각하면 필터가 감지 할 수있는 패턴의 가능성이 더 많습니까?) – hmmmbob

+0

모델을 변경해야한다고 생각하지 않습니다. 32 또는 64 개의 커널이 이미 3 색을 캡처하는 데 충분합니다. –

+0

고맙습니다 .. 나는 당신이 옳다고 확신합니다. 제 질문은 더 이론적 인 것이 었습니다. 단색보다 이론적으로 많은 색상이 커널에 보증되어야합니다. – hmmmbob

관련 문제