2012-09-03 7 views
3

tesseract 교육에 관한 질문이 있습니다. 현재 자바 프로그램 내에서 tesseract를 통합하기 위해 Tess4J를 사용하고 있습니다. tesseract 교육 (http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3)에서 tesseract 위키 페이지를 읽으면 다양한 조합과 글꼴이있는 교육 이미지를 사용하여 tesseract를 학습 할 수 있습니다.Tesseract and Tess4J

이 lang.traineddata 파일을 구성하는 "일반"tesseract 3.02 (Windows 또는 Unix) 설치를 수행 한 다음이 파일을 내 java 프로그램의 Tess4J 래퍼에서 사용하는 tessdata 폴더에 포함시킬 수 있습니까? 또는 Tess4J는 영어에 포함 된 언어 데이터 및 프로그램과 함께 제공되는 샘플 이미지로 제한됩니까?

그렇다면 Tess4J 빌드에 다른 방법으로 포함시킬 수 있습니까?

답변

2

Tesseract OCR 엔진의 래퍼 일 뿐이므로 표준 문제 또는 사용자 지정 교육 데이터 파일을 사용할 수 있습니다. 표준 훈련 데이터는 https://github.com/tesseract-ocr/tessdata입니다.

+0

완벽, 고맙습니다. –