3

나는 이미지에서 동물을 탐지하기 위해 계단식 분류기를 훈련 중이다. 불행히도 나의 위양성 비율은 꽤 높습니다 (Haar와 LBP를 사용하는 초고속, HOG를 사용하여 수용 가능). 내 분류기를 어떻게 개선 할 수 있는지 궁금합니다.강력한 계단식 분류기를 교육 할 때 고려해야 할 사항?

여기 내 질문은 :

  • 강력한 탐지에 필요한 훈련 샘플의 양이 무엇

    ? 나는 4000 위치와 800 neg 샘플이 필요하다고 어딘가에서 읽었습니다. 좋은 견적입니까?
  • 훈련 샘플은 어떻게 다릅니 까? 가능한 '중복'데이터를 포함/제외시키기 위해 이미지의 차이를 수량화하는 방법이 있습니까?
  • 어떻게 폐색 된 객체를 처리해야합니까? 가시적 인 동물의 부분 만 훈련해야합니까, 아니면 평균 ROI가 상당히 일정하도록 ROI를 선택해야합니까?
  • 동물은 다리, 팔, 꼬리, 머리 등이 있습니다. 일부 신체 부위는 꽤 자주 가려지기 때문에 '몸통'을 ROI로 선택하는 것이 합리적입니까?
  • 이미지 크기를 줄이고 이미지 크기를 줄여야합니까? 이게 상황을 개선 할 수 있을까요?

나는 여기에 어떤 포인터가 열려 있습니다!

답변

7
  • 4000 pos - 800 네가 나쁜 비율입니다. 부정적인 샘플을 가진 것은 Adaboost ML algorithm (모든 haar와 유사한 기능 선택 프로세스의 핵심 알고리즘)이 매우 중요하다는 점에서 가능한 한 많은 시스템을 교육해야한다는 것입니다. 4000/10000을 사용하는 것이 좋습니다.
  • "동물"을 탐지하는 것은 어려운 문제입니다. 문제는 이미 NP-hard 인 의사 결정 프로세스이므로 분류 범위가 복잡해지고 있습니다. 먼저 고양이부터 시작하십시오. 고양이를 탐지하는 시스템을 갖추십시오. 그런 다음 개에게도 똑같이 적용하십시오. 40 개의 시스템을 사용하여 다른 동물을 감지하고 나중에 목적에 맞게 사용하십시오.
  • 교육을 위해, 폐색 된 물체를 긍정적 인 것으로 사용하지 마십시오. 즉 정면의 얼굴을 감지하고 싶다면 정면의 얼굴을 정위 및 방향 변경 만 적용하여 정면에 훈련 시키십시오.
  • 하향식 분류기 자체가 모든 것을 24x24 크기로 축소하므로 다운 스케일링이 중요하지 않습니다. 시간이 충분할 때 전체 비올라 존스 프리젠 테이션을 시청하십시오.
  • 행운을 비네.
+0

+1; 올바른 길을 가야하는 포괄적 인 대답 – GPPK

+0

가양 성을 어떻게 다루는 지 조언 해주십시오. 내 현재 데이터를 사용하면 분류 데이터를 제공하는 ROI가이 둥근 객체와 겹치지 않고 ROI가 잘못 검출 된 객체보다 크더라도 분류기는 작은 둥근 객체를 선택하는 경향이 있습니다. 어떤 충고를 어떻게 처리해야합니까? – memyself

+0

적용한 교육 패턴 (ROI)은 그레이 스케일링, 임계 값 지정 및 24x24 크기로 축소됩니다. 당신의 시스템은 [haar-like features] (http://mmlab.disi.unitn.it/wiki/images/7/71/Haar.png)의 중요성을 결정합니다. 예를 들어, 당신이 제공하는 긍정적 인 - 애니멀 - 코를 가지고 있기 때문에, 라인 특징 (a)는 중요성 (더 높은 가중치)을 가지고 있습니다. 동물을 동물로 분류하려면 이미지에서 감지되어야합니다. 그리고 네거티브는 반대입니다. ROI의 크기는 중요하지 않습니다. 당신의 긍정적 인면을 서로 비슷하게 만드십시오. 음화에는 동물과 같은 그림이 없어야합니다. – baci

관련 문제