2011-01-27 3 views
5

이 사진의 독서를 추출하기 위해 Matlab에서 광학 문자 인식 프로그램 (또는이를 수행 할 수있는 다른 언어)을 개발해야합니다.사진을위한 광학 문자 인식 프로그램

프로그램을 통해 작업해야하는 사진이 약 40000 장이므로 최대한 많은 사진 파일을 업로드 할 수 있어야합니다.

이 작업의 일반적인 목적은 사진의 특정 가스 계량기에서 하루 동안 가스 측정을 기록한다. 현재 웹캠이 설치되어 매분마다 판독 값을 사진으로 찍을 수 있도록 프로그래밍되어 있으므로 OCR 프로그램은 역사적인 일간 가스 판독 데이터를 갖는 데 도움이됩니다.

이 작업을 수행하는 데 가장 적합한 소프트웨어는 무엇이며 어떤 온라인 소스를 사용할 수 있습니까 ?? 다음과 같이

+0

무엇이 질문입니까? –

+0

@ Yochai Timmer 마지막 ​​줄 : P 그것에 대해 감사드립니다. – Apollon1954

+1

당신은 당신의 통제하에 무엇을 가지고 있습니까? 즉, 웹캠을 적당한 위치에 배치 할 수 있습니까? 추가 조명을 사용할 수 있습니까? –

답변

4

나는 기본적인 인식 단계를 무너 뜨리는 것 :

  1. 이미지
  2. 분리 내에 미터 디스플레이를 찾아
  3. 계산은을 사용하여
  4. 분류 각 숫자를 특징으로 자리를 정리 역사적인 사례를 사용하여 숙련 된 모델

특정 위치 d에 대한 카메라 이동하지 않으면 1 단계는 한 번만 수행하면됩니다. 2 단계에는 대비 강화 및 노이즈 필터링과 같은 것들이 포함됩니다. 3 단계는 "잉크"(흰색) 픽셀의 평균 및 비뚤어 짐과 같은 생각할 수있는 유용한 계산을 포함 할 수 있습니다. 4 단계는 한 자리를 '0', '1', ... '9'로 분류하고 k- 가장 가까운 이웃, 로지스틱 회귀, SVM, 신경 네트워크 등을 사용하여 수행 할 수있는 모델을 활용합니다.

+1

알파벳을 0-9로 제한하는 것을 잊지 마십시오. – Dave

2

몇 가지 예는 Predictor 's answererer에서 1을 쉽게 만들 수 있습니다. 카메라를 미터 위에 직접 배치하고, 충분한 빛을 추가하고, 디스플레이 주위를 분할하는 데 도움이되도록 미터 주위에 밝은 핑크 스트립을 배치 할 수 있습니다. :).

일단이 작업을 수행하고 캠을 고정하면 수동 프로세스를 한 번 사용한 다음 모든 후속 이미지에 적용하여 숫자를 세그먼트화할 수 있습니다. 조명이 좋고 일관성이 있다면 단순한 템플릿 매칭을 사용하여 각 세그먼트 숫자를 식별 할 수 있습니다.

실제로 모든 자릿수 샘플을 얻은 후에는 임계 값이 적용된 사진의 합계와 같이 더 간단한 것으로 분류 할 수도 있습니다.

관련 문제