의미 론적 세그멘테이션 페이퍼를 읽을 때 언젠가 나는 마스크 이미지의 one-hot 라벨링과 같은 용어를 읽을 수 있습니다. 나는 그것이 정말로 무엇을 의미하는지 명확하지 않다. 일부 구현을 읽을 때, 나는 그들이 일반적으로 모양을 볼 수 있습니다. rows*columns*2
의미 론적 세분화를위한 one-hot-labeling
내 생각에 하나의 채널은 전경에 해당하고 다른 하나는 배경에 해당합니다. 그게 맞습니까? 더 나아가 어떻게 내가 전경인지 알 수 있습니까? 기존 훈련 세트가 모양이 rows*columns*1
인 경우. 이 형식 (예 : rows*columns*2
)으로 어떻게 전송할 수 있습니까? 내가 뭘하는지는 newimage[:,:,:,0] = original_image
과 newimage[:,:,:,1] = 1-original_image
을 사용하는 것입니다. 그러나 그것이 옳은지 나는 확신하지 못한다.
이 u-net 논문과 마찬가지로 https://arxiv.org/pdf/1505.04597.pdf에서 softmax 활성화 및 로그 손실이있는 2 개의 출력 채널을 사용했습니다 – user785099
4 페이지 하단의 해당 논문에서 전경/배경 마스크와 각 클래스의 범주 형 라벨을 페이지 5 상단에 언급 된대로 사용하십시오. 그래서 내가 믿는 출력 마스크가 두 개인 이유입니다. – Steven