미리 작성된 양식을 직접 작성하여 데이터 입력을 자동화하려고합니다. 문자는 구분되지 않지만 필드는 테이블 아래 또는 테이블의 일부로 식별 할 수 있습니다. 나는 필기 OCR이 여전히 활발한 연구 분야이며, 나는 운전자 리뷰 기능을 포함 할 수 있으므로 정확도가 90 %를 넘을 것이라고 기대하지 않습니다.미리 정의 된 양식에 필기 입력을위한 필드 식별 및 OCR (Optical Character Recognition)을 통한 데이터 입력 자동화
필자가 생각한 첫 번째 해결책은 필드 식별 (http://answers.opencv.org/question/63847/how-to-extract-tables-from-an-image/)을위한 OpenCV와 필기체 (https://github.com/openpaperwork/pyocr)를 인식하는 Tesseract의 조합입니다.
미리 정의 된 양식을 사용하여 필드를 식별 할 수있는 또 다른 잠재적 인 간단하고 효과적인 방법은 여하튼 채워진 양식에서 공백 양식을 빼는 것입니다. 양식을 스캔 할 것이므로 일부 위치 허용 오차, 노이즈 감소 및 피쳐 인식이 필요할 수 있습니다.
어떤 제안이나 의견이라도 대단히 감사하겠습니다.
일반적인 접근 방법을 얻으려면 https://stackoverflow.com/questions/33452222/detect-table-with-opencv/46806306#46806306을 참조하십시오. – flamelite