2012-02-03 3 views
1

나는 명령 행에서 tesseract를 사용하여 열린 창 내용에 OCR을 실행하려고합니다. 특히 현재 열려있는 메모장 창에 입력 된 텍스트를 읽으 려합니다.열린 창에서 명령 줄에서 tesseract를 사용하여 어떻게 읽을 수 있습니까?

나는 문서와 여기에 위키 읽은

: 나는 더 이상 내가 비슷한 질문을 여기를 검색 한,이 프로젝트에 나를 도와 아무것도 찾지 못했습니다 http://code.google.com/p/tesseract-ocr/w/list

하지만를 (약 많습니다 OCR) 그러나 아무것도 작동하지 않는 것/내 경우에는 적용 가능합니다.

실현 가능합니까?

저는 주로 PHP 코더 (재미있는 코딩)이며 웹 이외의 언어에 대한 경험이 없습니다.

미리 감사드립니다.

답변

2

Tesseract는 TIFF 이미지를 입력으로 사용하도록 설계되었으며 Windows 또는 화면 장치 컨텍스트에 대해 아무 것도 모릅니다. 따라서 메모장 창에 대한 창 핸들을 찾기위한 코드를 추가하고, 화면 캡처를 수행하고, Windows에서보고 한 현재 창 크기를 기준으로 창을 잘라내어 결과 이미지를 파일에 저장해야합니다. 이 이미지는 Tesseract 2.0이 B/W 이미지에서만 작동하는 것으로 의심하기 때문에 OCR에 더 쉽게 할 수있는 흑백입니다. 다음 문제는 원본 이미지의 낮은 DPI (해상도)로 인해 불량한 결과가 나타나는 문제입니다.

당신의 접근 방식의 적합성을 평가하기 위해 나는 메모장을 열고, 스크린 샷을 찍고, MSPaint에서 스크린 샷을 열고, OCR로 원하는 텍스트를 자르고, 잘린 이미지를 TIFF 나 BMP로 저장하고 이것을 보내 몇 가지 수동 테스트를 수행 할 것입니다. Tesseract에 제출하십시오. 결과가 필요하거나 기대만큼 좋지 않은 경우 많은 시간과 노력을 절약 할 수 있습니다.

관련 문제