2014-10-20 2 views
0

tess4j OCR 응용 프로그램에서 문자 인식의 정확성이 매우 낮습니다. 나는 tess4j에서 사전을 끄면 개별 문자를 인식하게함으로써 정확도가 증가된다고 들었습니다. 그러나 나는 그것을 어떻게하는지 모른다. 누구든지 tess4j에서 사전을 끄는 법을 알고 있습니까?tess4j에서 사전을 끄려면 어떻게해야합니까?

+0

안녕 당신이 문제를 해결하는 데 도움이 되었습니까를? 나는 인식의 정확성을 높이기 위해 Regex를 사용하려는 거의 동일한 문제를 가지고있다. 예를 들어 이미지의 텍스트는 고정 된 텍스트 '\ d \ d \ w \ w \ d \ d'이다. 어떻게 할 수 있는가? Java의 tessertact에서 –

답변

2

는 다음과 같이

TessBaseAPISetVariable(handle, "load_system_dawg", "F"); 
TessBaseAPISetVariable(handle, "load_freq_dawg", "F"); 

또는

setTessVariable("load_system_dawg", "F"); 
setTessVariable("load_freq_dawg", "F"); 

업데이트 :

예를 들어, bazaarconfigs 폴더 아래에 위치라는 파일에 다음을 넣어 :

을,210

한 다음 적절한 방법으로 파일의 이름을 전달 :

List<String> configs = Arrays.asList("bazaar"); 
instance.setConfigs(configs); 

참고 :
http://tesseract-ocr.googlecode.com/svn/trunk/doc/tesseract.1.html
http://tess4j.sourceforge.net/docs/docs-1.4/

+0

나는 빈 user_words_suffix 및 user_pattern_suffix 파일도 제공해야한다고 생각합니다. –

관련 문제