2012-04-06 3 views
1

내 강사는 을 image retrieval으로 슬라이드합니다. 즉, 먼저 이미지를 4x4 blocks으로 나눠야하고 horizontal, vertical, +45°, and -45° orientations에서 가장자리를 확인해야한다고 나와 있습니다. 그런 다음 그는 14x1 histogram으로 표시됩니다. 14x1 histogram을 만들어야한다고 결정한 방법에 대해 알지 못합니다. 누구든지 그가 어떻게이 가치를 생각해 냈는지 또는 edge histogram을 만드는 방법을 알고 있습니까?이미지 검색 - 가장자리 히스토그램

감사합니다.

답변

3

당신이 말하는 것을 Histogram of Oriented Gradients (HoG)라고합니다. 그러나, 수학은 당신의 모범을 위해 작동하지 않습니다. 일반적으로 공간 비닝 매개 변수 (4x4 블록)를 선택합니다. 각 블록에 대해 몇 가지 방향 (사용자의 경우 2 방향)에서의 그래디언트 크기를 계산합니다. 따라서 각 블록에는 N_{directions} 측정 값이 있습니다. 이것을 블록 수 (사용자의 경우 16)로 곱하면 16*N_{directions} 총 측정 값이 있음을 알 수 있습니다.

히스토그램을 형성하려면이 측정 값을 하나의 긴 벡터로 연결하기 만하면됩니다. bin/direction 콤보를 1 차원 막대 그래프의 슬롯에 매핑하는 방법을 추적하는 한 연결을 수행하는 방법은 아무 문제가 없습니다. 이러한 연결의 긴 히스토그램은 주로 그라디언트의 방향을 기반으로 이미지의 일부분을 인식하기 위해 분류자를 훈련하는 것과 같은 기계 학습 작업에 사용됩니다.

하지만 16 개의 서로 다른 이미지 블록 (이미지 블록의 4x4 격자)이있는 경우 교수가 특별한 것을해야합니다. 결국 블록 당 1 회 미만의 측정을 수행해야합니다. 전체 히스토그램에서 총 14 개의 측정 값이 있습니다.

또는 교수는 [-45, + 45] 사이의 각도 범위를 사용하여이를 -45, -45 + 90/14, -45 + 2 * 등 14 개의 다른 값으로 나눌 수 있습니다. 90/14, ... 등등.

이것이 교수가 의미하는 것이라면, 그 경우에 한 블록 내에 14 개의 방향 각인을 얻습니다. 모든 것이 연결되면 전체 이미지 전체를 설명하는 하나의 매우 긴 14 * 16 = 224 구성 요소 벡터를 갖게됩니다.

덧붙여서, 나는 히스토그램의 그라디언트를 Python으로 구현하여 많은 테스트를 수행 했으므로 here 또는 here과 연결된 일부 작업을 볼 수 있습니다. HoG의보다 잘 지원되는 버전이 scikits.image에 나타나지만 그 사이트에 몇 가지 예제 코드가 있습니다.

+0

왜 내 방향이 2면입니까? 물론 왼쪽에서 오른쪽, 아래에서 아래, 왼쪽 아래에서 오른쪽 위, 왼쪽 위에서 아래로 오른쪽입니다. 히스토그램을 조금 더 설명해 주시겠습니까? 그라디언트의 크기가 히스토그램을 만드는 데 어떻게 사용되는지 매우 혼란 스럽습니다. 저는 항상 히스토그램에 Y 축에 주파수가있는 것을 보았습니다. 그러나이 경우 주파수가 무엇인지 확실하지 않습니다. – TheBoss

+1

방금 ​​2 개의 지시가 있다고 말했을 때, 나는 당신이 첫 번째 지점으로 가려고했는데, 여기서 당신은 단지 +/- 45도를 말했습니다. 분명히, 실제로, 당신은 이것보다 더 많은 방향을 원할 것입니다. 나는 나중에 당신의 교수가 -45와 +45 사이의 모든 방향을 취하여 방향의 격자로 이등분한다는 것을 의미한다고 말했을 때 명확히했습니다. 두 가지 접근 방식이 있습니다. 때로는 사람들이 전체 방향의 원을 이산화하고 다른 경우에는 원의 절반만을 이산화 할 것입니다. 가장 일반적으로, 당신은 절대 방향에 대해서만 신경을 쓰고 기호는 중요하지 않습니다. – ely

+2

"주파수"축에 관해서는이 경우 각 "픽셀"에 해당 픽셀의 그래디언트 크기가 포함 된 완전히 새로운 "이미지"를 계산합니다.(i, j)의 픽셀에 그래디언트 크기 M 및 그래디언트 방향 D가있는 경우 방향 D가 속한 각도 저장소 (선택한 이산 각 그리드를 기반으로 함)를 파악하고 막대 그래프의 해당 슬롯에 크기 M입니다. 따라서 주어진 픽셀이 히스토그램에 기여하는 "주파수"는 해당 픽셀에서의 그래디언트의 크기입니다. – ely

관련 문제