19

저는 키포인트 탐지와 매칭을 위해 OpenCV 2.3을 사용하고 있습니다. 그러나 나는 감지 알고리즘에 의해 주어진 sizeresponse 매개 변수와 약간 혼동합니다. 그들은 정확히 무엇을 의미합니까? OpenCV의 설명서를 기반으로 SURF 키포인트에서 크기와 응답이 정확히 무엇을 나타내는가?

, 나는 그것을 알아낼 수 없습니다 :

float size : 가장 강력한 키포인트가 이 선택되어있는 응답 : 의미있는 키포인트 지역

float response의 직경 . 추가 정렬 또는 서브 샘플링에 사용할 수 있습니다

추적 할 때 가장 좋은 점은 가장 높은 응답을 가진 것이지만 그것이 사실이 아닌 것처럼 보입니다. 그렇다면 서핑 탐지기가 반환 한 핵심 포인트를 어떻게 서브 샘플링하여 추적 가능성 측면에서 최상의 점만 유지할 수 있습니까?

답변

59

크기 응답

SURF는 얼룩 검출부는, 요컨대, 피쳐의 크기가 블롭의 사이즈이다. 더 정확히 말하면, OpenCV에 의해 반환 된 크기는 근사화 된 헤 시안 연산자의 길이의 절반입니다. 크기는 스케일 (scale)로도 알려져 있는데, 이는 얼룩 검출기가 작동하는 방식, 즉 여러 스케일에서 가우시안 필터로 이미지를 먼저 흐리게 처리 한 다음 이미지를 다운 샘플링하고 최종적으로 고정 된 크기로 얼룩을 검출하는 것과 기능적으로 동일하기 때문입니다. SURF 기능의 크기를 보여주는 아래 이미지를 참조하십시오. 각 피쳐의 크기는 그려진 원의 반경입니다. 피처의 중심에서 원주로가는 선은 각도 또는 방향을 나타냅니다. 이 이미지에서 얼룩 검출 필터의 응답 강도는 색으로 구분됩니다. 탐지 된 기능의 대다수가 약한 응답을 볼 수 있습니다.

histogram showing distribution of response strengths

어떻게 추적 기능 :

SURF features

이 히스토그램은 상기 이미지의 특성의 반응 강도의 분포를 나타낸다 (here 전체 크기의 이미지 참조)?

가장 강력한 기능 추적기는 감지 된 모든 기능을 추적합니다. 더 많은 기능이 더 견고합니다. 그러나 종종 계산 시간을 제한하기 위해 많은 수의 기능을 추적하는 것은 비현실적입니다.추적 할 기능의 수는 각 애플리케이션마다 경험적으로 조정해야합니다. 흔히 이미지는 정규 하위 영역으로 나뉘며 각 영역에서 가장 강한 특징이 추적되도록 유지됩니다. n은 대개 프레임 당 약 500 ~ 1000 개의 피쳐가 검출되도록 선택된다.

참조합니다 journal paper describing SURF 확실히 당신에게 그것이 작동하는 방법의 좋은 아이디어를 줄 것이다 읽기

. 특히 배경이 기계/컴퓨터 비전 또는 이미지 처리가 아닌 경우 세부 사항에 집착하지 않도록하십시오. SURF 검출기는 처음 보았을 때 극히 새로운 것으로 보일지 모르지만, 전체 아이디어는 SURF 이전의 다른 방법으로 사용 된 적분 영상을 사용하여 헤 시안 연산자 (잘 설정된 필터)를 추정하는 것입니다. SURF를 잘 이해하고 이미지 처리에 익숙하지 않은 경우 돌아가서 입문 자료를 읽어야합니다. 최근에 나는 a new and free book을 발견했는데, 13 장에서는 기능 감지에 대해 간략하게 소개합니다. 기술적으로 정확한 것은 전부는 아니지만 좋은 시작점입니다. Here 당신은 각 단계가 어떻게 작동하는지 보여주는 몇 가지 이미지로 SURF의 다른 좋은 설명을 찾을 수 있습니다. 이 페이지에서이 이미지 참조 : 당신은 흰색과 검은 색 얼룩을 볼 수 있습니다

SURF blobs

를, 이들은 SURF 여러 규모로 감지하고 그 크기합니다 (OpenCV의 코드에서 반경)를 추정 모양이다.

+0

매우 명확한 대답입니다. 고마워. SURF에 대해 꽤 많이 알고있는 것 같아서 한 가지 더 묻고 싶습니다. SURF 감지기 및 추출기에 대해 살펴볼 가치가있는 opencv 매뉴얼 가이드 외에 어떤 문서가 있습니까? – Tulkkas

+0

당신을 진심으로 환영합니다. 방금 대답을 편집했습니다. 도움이 되길 바랍니다. – fireant

+0

그레이트 thx. 사실 컴퓨터 과학에 대한 배경 지식이 있지만 SURF의 openCV 구현에 대한 정보가 더 많습니다. 관심있는 사람들을 위해 SURF가 기반이되는 SIFT를 설명하는이 웹 사이트 [link] (http://www.aishack.in/2010/05/sift-scale-invariant-feature-transform/)도 발견했습니다. – Tulkkas

5
  1. 는 "크기"는 (또, 스케일 공간 내의 원래의 이미지를 다운 샘플링하여 원본 이미지의 기술자에 의해 커버되는 영역의 크기가 수득된다, 따라서 그것은 기반으로 핵심 키 포인트에서 변화들이 규모).

  2. "reponse"는 참으로 "얼마나 좋은가"(대충 말하면, 모서리가 다름) 점을 나타냅니다.

  3. 좋은 점은 정적 장면 검색에 안정적입니다 (이것이 SIFT/SURF 기술자의 주요 목적 임). 추적의 경우, 추적 된 객체가 잘 형성된 배경, 그림자의 절반, ...이 상태가 변경 되었기 때문에 사라지는 좋은 점을 나타낼 수 있습니다 (빛, 오 클루 전 변경 ...). 따라서 좋은 점이 항상있을 것이라는 점을 추적 작업에 보장 할 수는 없습니다.

+0

좋은 키포인트에는 크거나 작은 응답이 있습니까? –

관련 문제