2017-10-04 2 views
0

최근에 릴리스 된 tensorflow/models /../ object_detection 모델, 특히 더 빠른 r-cnn을 검토했습니다.4 단계 교대 RPN/빠른 R-CNN 교육? - Tensorflow 객체 감지 모델

용지가, 다음,

  • 기차 RPN을 RCNN 레이어를 동결하면, 다음 RPN 레이어를

    1. 열차 RPN을 동결 4 ​​단계 교대 교육,
    2. 기차 RCNN을 언급 한 후 동결 RPN 층
    3. 열차 RCNN. 단계에서
    4. 내가 수집 무엇부터

    는 2 RCNN, RPN은 참으로 동결 =

    if self._is_training: 
        proposal_boxes = tf.stop_gradient(proposal_boxes) 
    

    그래서 RPN +는 RPN 레이어를 동결 훈련, RCNN 훈련 다음이 포함되어 있지만, 어디 다른입니다 3 단계 수행?

    내가 누락 된 항목이 있습니까?

  • 답변

    2

    TF Object Detection API에서의 Faster R-CNN 구현은이 논문을 아주 자세히 따르지만 몇 가지 점에서 다릅니다. 그리고 그 차이점 중 하나는 우리가 종이에서 사용 된 교대 훈련 대신에 종단 간 모델을 훈련시키는 것입니다.

    언급 한 stop_gradient는 실제로 RPN을 고정시키지 않습니다. 제안 된 좌표를 통해 그라디언트의 기여도를 무시하지만 그래디언트가 RPN 기능을 계속 통과 할 수있게합니다.

    희망이 도움이됩니다.

    +0

    고마워요 조나단! 다른 코드베이스와 비교해 보았습니다. 실제로 4 단계 교대 알고리즘을 구현하는 사람은 거의 없습니다. 대략적인 공동 훈련을 사용하기 때문에 그라데이션이 통과하지 못하나요? 기본적으로이 솔루션은 "네트워크 응답 인 제안서 상자의 좌표와 파생어를 무시합니다". non-approx를 구현하려면 RoI Warping Layer와 교환해야합니다 ... – macguy

    +0

    우리는 (crop_and_resize가 완벽하게 차별화 될 수 있고 기본적으로 ROIAlign 작업과 동일하므로 그라데이션을 중지하지 않습니다. 어떤 서류에서 보았을 것입니다.) --- 우리는 훈련이 일찍 불안정하다는 것을 발견했기 때문에 멈추었습니다. –

    +0

    나는 많은 질문을 가지고있다! 나는 그것의 일부만 함께 조각 수 있습니다! Fast/Faster/X R-CNN의 1 단계에서 NMS를 사용하여 RPN 제안을 300으로 제한합니다. 더 빠른 R-CNN의 2 단계에서 300 개의 제안 상자를 사용하고 이미지 당 샘플 256 앵커, 최대 128 점의 앵커 및 나머지 -를 사용합니다. 해당 작업은 _unpad_proposals_and_sample_box_classifier_batch와 동일합니까? – macguy

    0

    StackOverflow의 어리석은 규칙 때문에 주석을 추가 할 수 없습니다. 나는 이것을 "대답"으로 써야합니다. 그러나 이것은 사실 Jonathan Huang의 답변에있는 질문을 따르고 있습니다.

    나는 여전히 스톱 그라데이션에 대해 혼란 스럽다. 상자의 그라디언트를 멈 추면 RPN 상자 정확도가 어떻게 향상 될 수 있습니까? 이 경우 감지 및 RPN 대상 정확도 만 향상되었지만 RPN 상자 정확도는 절대로 향상 될 수 없습니다.

    RPN 손실은 상자 손실과 개체 손실로 구성되지만 위치에 대한 그라데이션을 비활성화하면 256D 텐서에서 4K 좌표를 추정하는 매개 변수가 예를 들어 일정해질 수 있습니다. 그렇다면 RPN 상자 위치가 어떻게 개선 될까요?

    누구나 설명을 제공 할 수 있습니까? 고마워요

    관련 문제