2011-05-05 3 views
5

나는 HOG 디스크립터에 대해 연구하고 있는데, 나는 탐지 윈도우의 융합을 제외하고 대부분의 파트로 거의 끝났다.다중 스케일 (Orient Gradient)의 히스토그램

내가 지금까지 한 것은; 필자는 이미지의 스케일 피라미드를 만들고 각 스케일의 각 이미지에 대해 탐지 창 (64x128)을 이동시키고 사람을 감지합니다. 각 이미지에서 사람은 둘 이상의 창으로 감지됩니다.

그래서이 모든 창을 한 사람의 창으로 통합하는 방법이 궁금합니다. Dalal은 mean-shift와 같은 강력한 모드 탐지 알고리즘을 사용해야한다고 제안합니다. 하지만, 저울은 여러 개가 있습니다 ... 먼저 저 차원의 저울에서 발견 된 탐지 창의 정확한 위치를 추정해야합니까?

도움을 주시면 감사하겠습니다. 미리 감사드립니다.

답변

1

내 해석에 따르면 평균 변환은 당신이 제안하는 것을 효과적으로 제공 할 것입니다.

기본적으로 탐지기 출력의 강도를 기준으로 가장 조잡한 눈금에서 사람 위치의 확률 분포를 추정합니다. 이렇게하면 강력한 모드 추정치를 얻을 수 있습니다.

그런 다음 최대 또는 모드 주변의 미세한 눈금을 사용하여 반복적으로 수정할 수 있습니다.

피라미드 형 LK 추적에 사용되는 아이디어는 매우 유사합니다. 앙상블 처리 및/또는 입자 필터를 수행 할 수도 있습니다.