2011-02-06 7 views
0

OCR 응용 프로그램에서 일반적으로 이미지의 연결된 구성 요소를 발견하고이를 인식하기 위해 해당 구성 요소에 OCR 엔진을 실행합니다.OCR 기호 대 비 기호 감지/인식

연결된 구성 요소에 훈련 세트에 존재하지 않는 기호/모양이있는 경우 내 질문에 무엇이해야합니까?

예를 들어 숫자 인식을 실행하고 이미지에 직선이나 숯이 있으면 "X"또는 숫자가 아닌 다른 것을 말합니다.

숫자가 아님을 어떻게 알 수 있습니까?

+1

OCR 라이브러리는 근사값의 정확성과 같은 추측보다 더 많은 정보를 제공 할 가능성이 큽니다. 이 정보를 사용하십시오. – Tim

+0

시스템이 이런 종류의 결정을 내리는 데 도움이되도록 자신의 인식 엔진을 구축하거나 적어도 하나의 학습 엔진을 구축하려는 경우 "혼란"사례를 많이 도입하는 것을 고려해보십시오. – Predictor

답변

1

일반적으로 OCR 엔진은 인식 된 각 기호에 대해 신뢰도 점수를 제공합니다. 이 신뢰도에 허용 임계 값을 설정하면 숫자와 숫자가 아닌 정보를 구별 할 수 있습니다. 행운을 빌어 요.