2016-09-05 2 views
0

사용자 지정 데이터 집합에 caffe를 사용하여 더 빠른 RCNN을 학습하려고합니다. 나는 더 빠른 RCNN caffe 모델이 600 * 1000의 입력 이미지 크기를 고려하여 빌드됨을 인정했다. 내 사용자 정의 데이터 세트에 300 * 400 크기의 많은 이미지가 있습니다. 크기 600 * 100까지 이미지를 제로 패드해야하나요? 둘 다 아니라면, 이미지를 네트워크에 입력하기 전에 이미지를 수정해야합니다. 제발 제안 해주세요.더 빠른 RCNN caffe 모델에 적합한 이미지 크기 입력은 무엇이되어야합니까?

감사합니다.

+0

frcnn의 기본 '설정'을 변경하지 않으면 이미지가 확대됩니다. 입력 크기는 감지하려는 객체의 예상 크기를 반영해야합니다. – Shai

답변

2

더 빠른 RCNN은 사용자의 이미지 크기와 매우 가까운 파스칼 VOC 이미지 (파스칼 VOC의 경우 ~ 500 × 375)로 교육되었습니다. 이미지를 제로 또는 고급으로 만들 필요가 없습니다. 원본 파이썬 코드를 사용하는 경우 전체 프로세스의 일부입니다. 나는 그것을 그대로 사용할 수 있다고 생각합니다.

이미지가 크고 오브젝트가 작 으면 입력 이미지의 크기를 조정해야합니다.

예를 들어, 감지 할 100x100 개체가있는 3000x4000 이미지가 있습니다. 600x1000으로 크기를 조정하면 개체가 25x25에 가깝습니다. 그러나 수신 영역은 네트워크에서 하드 코딩됩니다 (각각 ZF 및 VGG의 경우 171 및 228 픽셀). 따라서이 경우에,이 대상 영역과 관련된 객체는 매우 작습니다. 긍정적 인 것을 묘사하는 기능이 실제로 전경보다 더 많은 배경 정보를 포함한다는 것을 의미합니다 ...

그 경우에는 최상의 방법은 훈련 단계의 이미지를 자르는 것입니다. 및 테스트).

관련 문제