2014-02-27 2 views
0

this 같은 이미지를 ImageMagick과 처리하여 tesseract-ocr을 사용하여 텍스트로 변환 할 수 있습니까?tesseract-ocr에 대한 이미지 전처리를위한 ImageMagick

배경에 선이 있기 때문에 나는 종래의 방법에서 난센스를 얻습니다. 아무도 이런 이미지를 어떻게 다룰 줄 압니까?

'변환 밀도 300 - 픽셀 PixerPerInch 유형 회색 음영 + 압축 input.png input.tif'다음에 'tesseract input.tif 출력 -l eng'은 나에게 완전한 쓰레기를 제공합니다.

또는 ImageMagick 대신 명령 줄이나 파이썬을 통해 이미지를 사전 처리하는 데 사용할 수있는 다른 방법이 있습니까?

답변

1

이미지를 회색 음영으로 변환 한 후 형태 조작 Morphology of Shapes을 사용해 보셨습니까?

관련 문제