큐브 모드 및 큐브 데이터 파일이 Tesseract ocr 엔진에 어떤 영향을 미치는지 설명하고이를 사용하는 이점은 무엇입니까?Tesseract Ocr Engine 큐브 모드 - 교육 Tesseract
그리고 그리스인에게 tesseract를 훈련시켜 더 나은 결과를 얻으려면 어떻게해야합니까?
큐브 모드 및 큐브 데이터 파일이 Tesseract ocr 엔진에 어떤 영향을 미치는지 설명하고이를 사용하는 이점은 무엇입니까?Tesseract Ocr Engine 큐브 모드 - 교육 Tesseract
그리고 그리스인에게 tesseract를 훈련시켜 더 나은 결과를 얻으려면 어떻게해야합니까?
여전히 관심이있는 사람들에게. Tesseract의 웹 사이트에는 각기 다른 파일에 대한 교육용 데이터 세트가 있습니다. 교육
https://code.google.com/p/tesseract-ocr/downloads/list?num=100&start=100
절차가 큐브의 경우
https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
(버전 3.01에 대한) 여기에서 설명하는 정팔 포체에 비해 다른 엔진, 그것은 더 많은 자원, 느린을 소비하지만, 제공 더 나은 결과.
데이터 파일 - 파일 집합으로, 마침내 traineddata 파일로 연결되어야합니다. 정팔 포체 - OCR-extradocs 프로젝트 위키 큐브 엔진 모드에서 필요로하는 다양한 교육 파일에 대한 설명이 있습니다
:
이https://code.google.com/p/tesseract-ocr-extradocs/wiki/Cube
당신이 방법에 대한 자세한 (불완전한) 정보를 찾을 수 있습니다 큐브 모드에서 교육에 필요한 파일을 만듭니다. 이 유용 할 수 있습니다 신경망 파일 형식에 대한 몇 가지 정보는 다음과 같습니다
https://code.google.com/p/tesseract-ocr-extradocs/wiki/nnFileFormat
큐브 모드는 종종 신경 네트워크 대신에 적응 분류기를 사용하여 더 나은 인식 결과를 줄 것이다.
본인이 직접 큐브 교육 파일을 만들지 않았으므로이 파일을 만드는 방법에 대한 자세한 정보는 제공 할 수 없습니다.