사용자가 그린 일련의 점을 분류하는 방법을 배우는 응용 프로그램을 만들고 싶습니다. 필기 인식과 같은 것입니다. 데이터 포인트가 (제스처 인스턴스에 해당하는 픽셀과 같은) 여러 (x, y) 쌍으로 구성된 경우, 좋은 다중 클래스 분류 자 (예 : SVM, NN 등)? 특히 제한된 훈련 사례가 제공된 경우.제스처 인식 기능
1
A
답변
1
내가 너라면, 모서리, 끝점 및 교차점에 해당하는 데이터 점을 찾아 피쳐로 사용하고 중간 점을 무시합니다. 이 관심 지점의 각도 또는 다른 설명자를 포함 할 수 있습니다.
관심 지점을 찾으려면 Harris detector을 사용할 수 있습니다. 그 때 그라디언트 값을 간단한 설명자로 사용할 수 있습니다. 또는 SIFT과 같은 더 멋진 방법으로 갈 수도 있습니다.
다운 샘플링 된 이미지의 모든 픽셀에 대한 설명자를 사용하고 SVM으로 분류 할 수 있습니다. 단점은 피쳐 벡터에 많은 양의 흥미로운 데이터 포인트가있을 것이라는 점입니다.
대안으로 분류 문제로 접근하는 것이 아니라 템플릿 매칭 문제 (computer-vision에서 상당히 일반적 임)로 접근하는 것입니다. 이 경우 제스처는 임의의 수의 관심 지점으로 지정되어 비 재미있는 데이터를 완전히 생략 할 수 있습니다. 인스턴스의 특정 임계 값 백분율은 긍정적 인 식별을위한 템플리트와 일치해야합니다. 예를 들어, 'R'인스턴스의 모서리 점을 'X'의 템플리트와 일치 시키면 맨 아래 오른쪽 점이 일치해야하며 같은 위치 방향의 끝점이지만 다른 점은 너무 유사하지 않으므로 상당히 낮습니다 점수 및 신분증 R = X는 거부됩니다.
관련 문제
- 1. iPhone 프로그래밍의 제스처 인식
- 2. Kinect 제스처 인식 이론
- 3. 제스처 인식 JavaScript 라이브러리
- 4. 제스처 인식 안드로이드
- 5. 카메라를 사용한 iOS 제스처 인식
- 6. iOS의 시스템 전체 제스처 인식
- 7. C# Wii Mote 제스처 인식
- 8. Android 앱에서 제스처 인식 구현
- 9. iOS 제스처 인식 및 처리
- 10. Android OpenCV 손 제스처 인식
- 11. 3D 제스처 인식 용 DTW
- 12. 제스처 인식 OpenCV (미디어 플레이어 용)
- 13. OpenCV를 사용하는 ASL 손 제스처 인식
- 14. iphone 개발 : 제스처 인식 스크롤링이 동시에 가능합니다.
- 15. 안드로이드에서의 비전 기반 손 제스처 인식
- 16. UIWebView 내에서 스 와이프 제스처 인식
- 17. 사용자 잘라내 기/문지름 제스처 인식 (UISwipeGestureRecognizer)
- 18. UIScrollView의 표준 팬 제스처 인식기에 기능 추가
- 19. 제스처 투 텍스트 인식, OCR 또는 제스처 기반, 네이티브 .NET 라이브러리
- 20. 하마 훈련과 숨겨진 마르코프 모델을 사용한 손 제스처 인식
- 21. ISGL3D에서 한 번에 하나의 제스처 만 인식 할 수 있습니까?
- 22. C#의 오픈 소스 비디오 제스처 인식 라이브러리
- 23. Android ViewFlipper + 제스처 감지기
- 24. TabBar의 손가락 제스처
- 25. 안드로이드의 제스처 예측 문제
- 26. Ios5 스 와이프 제스처
- 27. 제스처를 사용하여 숫자 인식
- 28. tabBarController에 탭 제스처 추가
- 29. 과정 터치 이벤트와 제스처 인식기
- 30. CGAffineTransformScale + 제스처
이것은 막연하고 개방 된 질문입니다. 지금까지 뭐 해봤 어? 어떤 종류의 공연이 필요합니까/기대합니까? 교육 예는 얼마나 제한적입니까? 나는 많은 제안을 줄 수는 있지만 적합하지 않을 수도있다. – Junuxx
인스턴스 수는 수십, 아마도 3 ~ 5 개의 개별 클래스입니다. 사용자는 2 차원 그리드에서 간단한 동작/모양을 대화 형으로 추적합니다 (예 : 대각선, 호, 지그재그 등입니다. 원시 데이터는 화면에서 추적 한 (x, y) 쌍 또는 (x, y, z) 세 쌍으로 된 3 차원 버전으로 구성됩니다. 제스처 주변 경계 상자, 이미지로 변환 (흰색 배경, 검정색 모양), 6x6이라고 말하기 위해 다운 샘플링하고 36 픽셀 값을 피쳐로 사용합니다 (또는 PCA를 사용하여 더 많은 차원을 줄임). 곡률을 기반으로 한 더 높은 수준의 기능이 더 좋을 것으로 생각됩니다. – genekogan