나는 HOG 디스크립터에 대해 연구하고 있는데, 나는 탐지 윈도우의 융합을 제외하고 대부분의 파트로 거의 끝났다.다중 스케일 (Orient Gradient)의 히스토그램
내가 지금까지 한 것은; 필자는 이미지의 스케일 피라미드를 만들고 각 스케일의 각 이미지에 대해 탐지 창 (64x128)을 이동시키고 사람을 감지합니다. 각 이미지에서 사람은 둘 이상의 창으로 감지됩니다.
그래서이 모든 창을 한 사람의 창으로 통합하는 방법이 궁금합니다. Dalal은 mean-shift와 같은 강력한 모드 탐지 알고리즘을 사용해야한다고 제안합니다. 하지만, 저울은 여러 개가 있습니다 ... 먼저 저 차원의 저울에서 발견 된 탐지 창의 정확한 위치를 추정해야합니까?
도움을 주시면 감사하겠습니다. 미리 감사드립니다.