이메일 양식을 OCR하고 추출하려고합니다. 이미지는 이메일 주소 인 한 줄의 텍스트가 있어야합니다.이메일 주소 OCR 방법
EmguCV.OCR을 사용하여 해당 이미지에서 텍스트 (전자 메일 주소)를 추출합니다. 목표는 100 % 정확한 결과를 얻는 것입니다.
텍스트의 글꼴과 크기를 수정할 수 있습니다. 예를 들어, Ariel, 12pt는 모든 이미지가 Ariel 12pt에 흰색으로 작성된 이메일을 가질 것입니다.
EmguCV의 Tesseract OCR이 텍스트를 제대로 인식하지 못하는 문제가 있습니다. 문자의 80 % 만 정확하게 인식합니다.
나는 Leptonica 라이브러리와 함께 전처리를 사용하고 있습니다.
다음은 인식하려는 일부 샘플 이미지입니다.
100 % 정확도의 목표 저도 같은 문제를 해결하기 위해 두 가지 방법을 제안 할 수 있습니다 그 샘플 이미지와
대비를 증가시키고 제거하는 노이즈를 가능한 한 많이, 더 나은 줄 간격, 글꼴 크기 및 유형을 (이 * 참고 : 자신의 텍스트를 읽을 수없는 경우 분명히을 얻을 기대하지 않습니다 100 %'OCR' 결과, 사용하는 소프트웨어 또는 라이브러리에 따라 다름) – Kyojimaru