응용 프로그램의 자동화 된 테스트를 위해 Tesseract OCR (pytesser 통해) 및 PIL (Python Image Library)을 사용하고 있습니다.OCR 소프트웨어의 성공 가능성을 높일 수있는 방법은 무엇입니까?
나는 스크린 샷을 만들고 tesseract 덕분에 텍스트를 가져 와서 표시된 텍스트가 괜찮은지 확인하고 있습니다.
처음에는 몇 가지 문제가 있었지만 필자가 PIL의 바이 큐빅 보간 덕분에 스크린 샷의 크기를 늘렸으므로 더 잘 작동하는 것 같습니다.
불행히도, 나는 여전히 '0'과 'O'사이의 혼동과 같은 실수를 가지고 있습니다. 나는 앞으로도 비슷한 다른 이슈가있을 것이라고 상상할 수 있습니다.
OCR을 돕기 위해 이미지를 준비하는 몇 가지 기술이 있는지 알고 싶습니다. 어떤 아이디어라도 환영합니다. 0 O 구별 미리
이 질문은 여전히 관련이있는 경우 :이 정팔 포체해야합니까? 저품질 입력 이미지에 적합하고 자동으로 이미지 전처리를 수행하는 OCR 엔진 (예 : ABBYY)이 있습니다. http://www.wisetrend.com/wisetrend_ocr_cloud.shtml에서 ABBYY 엔진을 사용하는 OCR 용 REST API가 있습니다. 무료 평가판을 사용하므로 몇 가지 이미지를 직접 사용해 볼 수 있습니다. –