2012-10-04 2 views
0

주로 알려진 레이아웃의 레이블에서 특정 정보를 OCR해야합니다. 데이터의 출처는 내가 아는 사진이 까다로울 수 있습니다. 데이터는 바코드 (쉬운), 짧은 텍스트 (반복적으로 시간이 지남에 따라 학습 할 수있는 대부분 알려진 단어) 및 숫자 (형식 및 길이 설정) 일 수 있습니다.사진의 자르기 및 OCR 레이블

저는 몇 가지 연구를 해봤는데 Tesseract가 여러 플랫폼에서 원하는 것을 할 수 있지만 몇 가지 질문이있는 것으로 보입니다.

1) 관련 레이블 만 자르는 방법. 저는 오래 전에 대학 과정을위한 아주 기본적인 신호 처리를했습니다. 나는 이것이 너무 어렵지 않다고 생각한다. 그것을위한 좋은 라이브러리가 있습니까?

2) 레이아웃을 알고 있기 때문에 각 특정 값에 대해 섹션별로 라벨을 OCR하는 방법이 있습니까?

3) 사진 전처리에 대한 다른 정보는 요?

4) Tesseract는 작업에 적합한 도구입니까?

+0

약간의 샘플 이미지를 추가하십시오 –

답변

1

나는 전에 Tesseract를 다루지 않았다. 그러나 leadtools라는 타사 툴킷을 사용합니다. 이 툴킷은 바코드, 텍스트 및 숫자를 인식 한 다음 그 결과를 문서 형식으로 저장할 수 있습니다. 인식하려는 텍스트 주위에 특정 영역을 그리는 방법을 제공하고 이미지를 사전 처리하는 몇 가지 방법을 제공하므로 사용자의 요구 사항을 충족시킬 수 있습니다. 또한 OCR 할 파일에서 영역을 자동으로 찾을 수있는 기능을 제공합니다. 자세한 내용을 확인하실 수 있습니다 Tutorial

+0

당신은 그들을 위해 일하고 있다면 leadtools가 무료가 아니거나 공개 할 수 있음을 언급해야합니다 – BBog