2011-09-06 25 views
5

Tesseract를 기반으로하는 매우 간단한 OCR 앱이 있습니다. 단계를 인식 한 후 OCR이 잘못된 경우에 대비하여 을 수정할 수있는 사용자 확인 단계도 제공합니다. 사용자 인터페이스를 개선하기 위해 원본 입력 이미지의 OCR 처리 된 문자 위에 직사각형을 그리고 을 입력하여 OCR 출력과 나란히 놓을 계획입니다. 이를 위해 인식 된 문자의 좌표는 입니다.인식 된 문자의 좌표를 얻는 방법

나는 이런 식으로 뭔가를 시도했지만 나에게 횡설수설 줄 것으로 보인다 : 지금은 출력 -> 카운트에 액세스하는 경우

ETEXT_DESC output; 
    tess->Recognize(&output); 
    text = tess->GetUTF8Text(); 

를, 그것은 나에게 10,000 위의 몇 가지 값, 분명히 잘못 을 제공하는 전체 이미지 때문에 단 20 자 정도의 문자가 있습니다.

올바른 경로에 있습니까? 어떤 방향으로 주시겠습니까?

답변

5

아마 상자의 좌표를 가져 오는 것이 좋습니다. tesseract 실행 파일을 사용해보십시오. 각 문자, 행 당 하나의 좌표를 얻을 Afterall는 명령

에게 "tesseract.exe [이미지] [출력] makebox"

를 사용합니다. 그런 다음 비교할 수 있습니다.

+5

정보를 프로그래밍 방식으로 얻는 방법은 어떻습니까? – Haoest

1

tesseract 실행 파일은 옵션 hocr 출력 인식 자와 그 coordiantes에에서 HTML 형식이 있습니다. 이를 프로그래밍 방식으로 가져 오려면 FAQbaseapi.h을 말합니다.

관련 문제