OCR 소프트웨어의 성공 가능성을 높일 수있는 방법은 무엇입니까?

응용 프로그램의 자동화 된 테스트를 위해 Tesseract OCR (pytesser 통해) 및 PIL (Python Image Library)을 사용하고 있습니다.OCR 소프트웨어의 성공 가능성을 높일 수있는 방법은 무엇입니까?

나는 스크린 샷을 만들고 tesseract 덕분에 텍스트를 가져 와서 표시된 텍스트가 괜찮은지 확인하고 있습니다.

처음에는 몇 가지 문제가 있었지만 필자가 PIL의 바이 큐빅 보간 덕분에 스크린 샷의 크기를 늘렸으므로 더 잘 작동하는 것 같습니다.

불행히도, 나는 여전히 '0'과 'O'사이의 혼동과 같은 실수를 가지고 있습니다. 나는 앞으로도 비슷한 다른 이슈가있을 것이라고 상상할 수 있습니다.

OCR을 돕기 위해 이미지를 준비하는 몇 가지 기술이 있는지 알고 싶습니다. 어떤 아이디어라도 환영합니다. 0 O 구별 미리

출처

2009-08-26 luc

이 질문은 여전히 관련이있는 경우 :이 정팔 포체해야합니까? 저품질 입력 이미지에 적합하고 자동으로 이미지 전처리를 수행하는 OCR 엔진 (예 : ABBYY)이 있습니다. http://www.wisetrend.com/wisetrend_ocr_cloud.shtml에서 ABBYY 엔진을 사용하는 OCR 용 REST API가 있습니다. 무료 평가판을 사용하므로 몇 가지 이미지를 직접 사용해 볼 수 있습니다. –

뻔뻔 플러그 및 면책 조항 :

정팔 포체는 OK OCR 엔진입니다 .NET에서 사용하기에 my company 패키지 정팔 포체. 그것은 많은 것을 놓칠 수 있으며 비 텍스트로 쉽게 혼란 스러울 수 있습니다. 당신이 그것을 할 수있는 최선의 일은 텍스트 만 가져 오는 것입니다. 다음으로 가장 좋은 것은 2 진화 된 (adaptive or dynamic threshold) 또는 그레이 스케일 (grayscale)을 부여하고 이진화를 시도하도록하는 것입니다.

출처

2009-08-26 18:56:15 plinth

나는 그것에 동의한다. 대화 상자 가장자리로 혼란스럽고 'I'로 변환되었습니다. 텍스트 만 이미지를 얻으면 잘됩니다. 2 치화도 좋은 아이디어입니다. 감사. – luc