2010-02-15 3 views
0

이미지에서 발견 된 유형을 자동으로 분류하기 위해 어떤 접근 방식을 제안 하시겠습니까? 표본은 흰색 배경에 검은 색 문자로 표시 될 가능성이 큽니다.이미지 파일에서 유형 샘플 분류

각 카테고리 (Google 도서 링크)에 몇 가지 예가 나와 있습니다. http://bit.ly/9Mnu7P 이것은 VOX-ATypI 분류 시스템의 확장 버전입니다.

첫 번째 생각은 각 카테고리의 단일 문자 샘플을 많이 사용하여 시스템을 교육하는 것이었지만 한 번에 한 글자 씩 비교할 필요가 없어지는 더 좋은 방법이 있는지 궁금합니다.

+0

"컴퓨터 비전"으로 태그를 지정하는 것이 유용 할 수 있습니다. –

+0

태그가 지정되었습니다. 또한 내가 얼마나 비싼 솔루션을 사용하는지 피하려고 노력하고 있다고 덧붙이고 싶습니다. 이것은 유망 해 보입니다. http://www.ideeinc.com/products/piximilar/ –

+0

글쎄,해볼 수 있습니다. 그러나 일반적인 솔루션은 종종 비효율적이거나 비효율적입니다. 특정 방법을 구현해야한다고 생각합니다. 예를 들어, 색상 채도를 피쳐로 사용하는 것으로 보이며 이는 사용자의 경우 전혀 쓸모가 없습니다. –

답변

2

먼저 분류를 위해 피쳐를 추출해야합니다. 서체는 일반적으로 줄의 두께, 세리프의 존재, 인물의 "순환 성"으로 구별됩니다. 따라서 가능한 기능은 다음과 같습니다.

  • 고정 된 영역의 검정 픽셀 수의 비율입니다.
  • 이 부분
  • 계산 문자의 평균 컴팩트 수학의 형태를 erosion 몇 번을 적용 (및/또는 다른 마스크를 사용)을 시도하고 계산 : 주변^2/영역 침식을 적용하면
  • 을의 수를 계산 문자
  • 을 계산 신장 및 기타 image moments, 또한 방향에 대한 연결 구성 요소

여기 두 가지 옵션을 참조하십시오 중 하나 컴퓨팅은 FEA를 의미 모든 문자를 테스트하거나 문자를 먼저 분류하고 특정 문자를 기반으로 글꼴을 분류하는 것보다 (따라서 다른 분류자를 다른 문자로 훈련시키는 것). 어떤 사건이 더 나은지 말하기는 어렵습니다.

구체적인 학습 알고리즘은 Random Forest으로 시작하는 것이 좋습니다. OpenCV 라이브러리에 구현되어 있습니다.

관련 문제