제스처 인식 기능

사용자가 그린 일련의 점을 분류하는 방법을 배우는 응용 프로그램을 만들고 싶습니다. 필기 인식과 같은 것입니다. 데이터 포인트가 (제스처 인스턴스에 해당하는 픽셀과 같은) 여러 (x, y) 쌍으로 구성된 경우, 좋은 다중 클래스 분류 자 (예 : SVM, NN 등)? 특히 제한된 훈련 사례가 제공된 경우.제스처 인식 기능

출처

2012-06-13 genekogan

이것은 막연하고 개방 된 질문입니다. 지금까지 뭐 해봤 어? 어떤 종류의 공연이 필요합니까/기대합니까? 교육 예는 얼마나 제한적입니까? 나는 많은 제안을 줄 수는 있지만 적합하지 않을 수도있다. – Junuxx

인스턴스 수는 수십, 아마도 3 ~ 5 개의 개별 클래스입니다. 사용자는 2 차원 그리드에서 간단한 동작/모양을 대화 형으로 추적합니다 (예 : 대각선, 호, 지그재그 등입니다. 원시 데이터는 화면에서 추적 한 (x, y) 쌍 또는 (x, y, z) 세 쌍으로 된 3 차원 버전으로 구성됩니다. 제스처 주변 경계 상자, 이미지로 변환 (흰색 배경, 검정색 모양), 6x6이라고 말하기 위해 다운 샘플링하고 36 픽셀 값을 피쳐로 사용합니다 (또는 PCA를 사용하여 더 많은 차원을 줄임). 곡률을 기반으로 한 더 높은 수준의 기능이 더 좋을 것으로 생각됩니다. – genekogan

내가 너라면, 모서리, 끝점 및 교차점에 해당하는 데이터 점을 찾아 피쳐로 사용하고 중간 점을 무시합니다. 이 관심 지점의 각도 또는 다른 설명자를 포함 할 수 있습니다.

관심 지점을 찾으려면 Harris detector을 사용할 수 있습니다. 그 때 그라디언트 값을 간단한 설명자로 사용할 수 있습니다. 또는 SIFT과 같은 더 멋진 방법으로 갈 수도 있습니다.

다운 샘플링 된 이미지의 모든 픽셀에 대한 설명자를 사용하고 SVM으로 분류 할 수 있습니다. 단점은 피쳐 벡터에 많은 양의 흥미로운 데이터 포인트가있을 것이라는 점입니다.

대안으로 분류 문제로 접근하는 것이 아니라 템플릿 매칭 문제 (computer-vision에서 상당히 일반적 임)로 접근하는 것입니다. 이 경우 제스처는 임의의 수의 관심 지점으로 지정되어 비 재미있는 데이터를 완전히 생략 할 수 있습니다. 인스턴스의 특정 임계 값 백분율은 긍정적 인 식별을위한 템플리트와 일치해야합니다. 예를 들어, 'R'인스턴스의 모서리 점을 'X'의 템플리트와 일치 시키면 맨 아래 오른쪽 점이 일치해야하며 같은 위치 방향의 끝점이지만 다른 점은 너무 유사하지 않으므로 상당히 낮습니다 점수 및 신분증 R = X는 거부됩니다.

출처

2012-06-17 12:33:57 Junuxx

제스처 인식 기능

답변

관련 문제