2010-11-30 2 views
7

나는 Tesseract를 C++로 사용하는 방법에 대한 설명/API 문서/예제를 찾고 있습니다. Google Tesseract 페이지에는 아무 도움이되지 않지만 아직 웹에서 뭔가를 찾고 있습니다. .Tesseract 또는 다른 OCR lib

유용한 소스, 경험은 환영 할만한 것입니다. 시작하는 방법을 모르기 때문에.

P.S : 나는 다른 라이브러리에 대한 제안 열려있어

  1. . http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract 당신은 당신이하고자 정팔 포체의 버전을 선택해야합니다
  2. 무료 라이브러리

답변

4

내가 정팔 포체 ... '교육 정팔 포체'의 간단한 구글과 경험이이 페이지를 보여준다 train .. 3은 최신 버전이지만 새로운 버전이므로 여전히 버전 2.4를 사용하는 사람들은 여전히 ​​모든 문제를 해결하고 있습니다. 어쨌든 특정 '언어'(또는 '글꼴'또는 '문자 세트'라고 불렀던 것이 무엇인지)에 대해 tesseract를 훈련하는 데 약 9 단계가 있음을 알 수 있습니다. 기존 'eng'언어 만 사용할 수도 있지만 응용 프로그램에 따라 다릅니다. 예를 들어, 내 응용 프로그램에서 문서 분석을 수행하고 특정 지역을 가져야하고 OCR에 13 자리 숫자의 문자열을 입력하고 싶었고 높은 정확도가 필요했습니다. '5'는 ' S '와'0 '을'O '등으로 구분하여 0..9 문자만으로 구성된 특정 글꼴 세트의 특정'언어 '를 만드는 것이 논리적이었습니다.

+0

감사합니다. C++ 용 자습서/API 문서를 찾을 수있는 아이디어가 있습니까? – snoofkin

0

Tesseract Ocr은 광학 문자를 감지하기위한 오픈 소스 라이브러리입니다. Visual Studio를 사용하는 경우 라이브러리 파일 만 포함하면됩니다. qt creator를 사용하고 있다면 QT에서 작동하도록 라이브러리를 만들어야합니다. 라이브러리를 빌드하려면 CMakelist 또는 Cmake Gui를 사용해야합니다. 링크를 방문하십시오. Opencv Ocr build for Qt 5.4 mingw

관련 문제