2013-05-16 4 views

답변

3

여전히 관심이있는 사람들에게. Tesseract의 웹 사이트에는 각기 다른 파일에 대한 교육용 데이터 세트가 있습니다. 교육

https://code.google.com/p/tesseract-ocr/downloads/list?num=100&start=100

절차가 큐브의 경우

https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

(버전 3.01에 대한) 여기에서 설명하는 정팔 포체에 비해 다른 엔진, 그것은 더 많은 자원, 느린을 소비하지만, 제공 더 나은 결과.

데이터 파일 - 파일 집합으로, 마침내 traineddata 파일로 연결되어야합니다. 정팔 포체 - OCR-extradocs 프로젝트 위키 큐브 엔진 모드에서 필요로하는 다양한 교육 파일에 대한 설명이 있습니다

2

:

https://code.google.com/p/tesseract-ocr-extradocs/wiki/Cube

당신이 방법에 대한 자세한 (불완전한) 정보를 찾을 수 있습니다 큐브 모드에서 교육에 필요한 파일을 만듭니다. 이 유용 할 수 있습니다 신경망 파일 형식에 대한 몇 가지 정보는 다음과 같습니다

https://code.google.com/p/tesseract-ocr-extradocs/wiki/nnFileFormat

큐브 모드는 종종 신경 네트워크 대신에 적응 분류기를 사용하여 더 나은 인식 결과를 줄 것이다.

본인이 직접 큐브 교육 파일을 만들지 않았으므로이 파일을 만드는 방법에 대한 자세한 정보는 제공 할 수 없습니다.