주로 알려진 레이아웃의 레이블에서 특정 정보를 OCR해야합니다. 데이터의 출처는 내가 아는 사진이 까다로울 수 있습니다. 데이터는 바코드 (쉬운), 짧은 텍스트 (반복적으로 시간이 지남에 따라 학습 할 수있는 대부분 알려진 단어) 및 숫자 (형식 및 길이 설정) 일 수 있습니다.사진의 자르기 및 OCR 레이블
저는 몇 가지 연구를 해봤는데 Tesseract가 여러 플랫폼에서 원하는 것을 할 수 있지만 몇 가지 질문이있는 것으로 보입니다.
1) 관련 레이블 만 자르는 방법. 저는 오래 전에 대학 과정을위한 아주 기본적인 신호 처리를했습니다. 나는 이것이 너무 어렵지 않다고 생각한다. 그것을위한 좋은 라이브러리가 있습니까?
2) 레이아웃을 알고 있기 때문에 각 특정 값에 대해 섹션별로 라벨을 OCR하는 방법이 있습니까?
3) 사진 전처리에 대한 다른 정보는 요?
4) Tesseract는 작업에 적합한 도구입니까?
약간의 샘플 이미지를 추가하십시오 –