2013-10-28 3 views
0

이미지의 개체를 인식하고 계산할 때 사용할 수있는 OCR API가 있습니까? 또는 다른 이미지 처리 이미지 처리 기술로이 작업을 수행 할 수 있습니까?개체 수를 계산할 수있는 OCR API가 있습니까?

예를 들어 3 박스의 클로즈업 사진을 찍으면 API는 결과적으로 숫자 3을 반환합니다.

+0

OCR은 일반적인 개체와 어떤 관련이 있습니까? OCR이 문자 인식에 사용됩니다. – GilLevi

답변

0

이미지 처리 및 비전을 배우는 프로그래머에게 인기있는 OpenCV를 살펴볼 수 있습니다. OpenCV에 대한 StackOverflow에서 끝없는 게시물을 찾을 수 있습니다.

http://opencv.org/

일부 프리웨어 GUI를하고 코드를 작성하지 않고도 이미지 처리 기술을 테스트 할 수 상용 영상 처리 패키지의 무료 스타터 버전. ImageJ에 오래된하지만 여전히 체크 아웃 가치가있다 :

http://rsbweb.nih.gov/ij/

내가 이미지 처리 세계에서 내 형제 자매의 대한 편애하고 싶지 않아,하지만 당신은 "머신 비전 무료"또는 구글 경우 "컴퓨터 비전 프리"를 추가하고 "GUI"와 같은 단어를 추가하면 마우스를 사용하여 다른 이미지 처리 기술을 테스트 할 수있는 무료 소프트웨어를 빠르게 찾을 수 있습니다.

OCR 알고리즘과 함께 객체를 세분화하는 세분화 방법이 필요합니다.

http://en.wikipedia.org/wiki/Connected-component_labeling

전형적인 연결 구성 요소 알고리즘은 약간의 전처리에 의존하는 것 :

  1. 는 이진화 임계 값을 찾기

    하나 개는 이러한 기술은 연결된 구성 요소 알고리즘입니다.

  2. 검정 (0) 및 흰색 (1) 값의 이미지를 생성하려면 2 진화 임계 값을 적용하십시오.
  3. 연결 구성 알고리즘을 실행하고 모든 구성 요소 (개체)에 레이블을 지정하십시오.
  4. 결과를 크기 및 기타 매개 변수로 필터링하십시오. 예를 들어, 크기가 몇 픽셀 밖에없는 전경 개체를 포함하지 않을 수도 있습니다.
  5. 필터링 된 구성 요소 목록의 크기를 확인하십시오.

이것은 간단한 저수준 방법이지만 여러 상황에서 유용합니다. 비록 당신이 더 복잡한 기술을 필요로한다고 생각하더라도, 계속 전진하기 전에 먼저 연결된 컴포넌트에 익숙해지는 것이 좋습니다. 조명, 이진화 및 구성 요소 레이블 지정의 미묘함을 파악할 때까지는 더 복잡한 알고리즘에 대해 많은 것을 배울 수는 없습니다. 실제로 바로 가기가 없습니다.

다른 더 복잡한 방법이 있지만 어떤 것이 적합할지 제안하기 전에 어떤 종류의 개체를 찾고 싶은지 구체적으로 설명해야합니다.

모든 이미지 처리 질문에는 항상 하나 이상의 샘플 이미지가 포함됩니다. 일반적으로 작업중인 이미지 세트를 먼저 이해하지 않고 이미지 처리 알고리즘에 관해 이야기하는 것은 유용하지 않습니다. 다른 사람, 특히 OCR 응용 프로그램을 작성하는 데 많은 시간을 할애하고 다양한 배경, 스크립트 및 사양을 처리해야하는 사람들에게는 분명하지 않을 수 있습니다.

관련 문제