2010-11-23 2 views

답변

1

이는 애플리케이션 요구 사항에 따라 다릅니다.

일반적으로 OCR 엔진은 문자, 글꼴, 단어, 줄 또는 지역 정보 만 반환 할 수 있습니다. 최상의 결과를 얻으려면 다른 많은 모듈을 추가하고 조정해야합니다.

첫째, 카메라 OCR 애플리케이션에 이미지 전처리가 필요합니다. 가능한 한 깨끗한 이미지에 배경, 노이즈 제거, 이진화, 크기 조정 등을 추가해야합니다.

둘째, 텍스트 영역을 찾아야합니다. 알고리즘은 이미지 기능뿐만 아니라 OCR 목적에 달려 있습니다. 예를 들어 OCR 플레이트 번호가 필요한 경우 더 정확한 위치를 위해 플레이트 번호의 길이, 너비 또는 높이를 사용할 수 있습니다.

OCR 후에 일부 OCR 오류를 수정하기 위해 몇 가지 사후 처리를 추가 할 수 있습니다. Abyy, ExperVision, Omnipage, GOCR, Tesseract와 같은 일반적인 OCR 엔진은 모두 공통 문서, 잡지 또는 사무 용지에 따라 교육됩니다. 문서가 특수한 경우 OCR 계층에 대한 고급 데이터 추출 또는 분석 논리를 설정할 수 있습니다.

0

http://www.wisetrend.com/wisetrend_ocr_cloud.shtml에서 OCR API를 사용해 볼 수 있습니다. 모바일 플랫폼에서 사용하기가 매우 간편해야하는 REST API이며 모바일과 같은 저품질 이미지에 적합한 ABBYY OCR 엔진을 기반으로합니다. 전화 카메라. 면책 조항 : WiseTrend는 우리 회사의 고객입니다.

관련 문제