2017-01-29 2 views
0

현재 텍스트 인식을 다루고 있습니다. 다음은 가장자리 감지 (Canny 사용)이 포함 된 이진화 된 이미지의 일부입니다.OpenCV : 가장자리 감지 이미지에서 문자 및 단어 감지

편집 : 이미지에 대한 링크를 게시하려고합니다. 이미지를 게시 할 수 없기 때문에 10 포인트 만 남았습니다.

편집 2 : 여기 그리고는 임계 후 같은 작품이다. 솔직히 어느 접근법이 더 좋을지 모르겠습니다.

[2

질문은 동일하게 유지 :

  1. 가 어떻게 특정 문자를 감지해야합니까? 나는 모든 문자의 위치와 모든 단어의 위치를 ​​결정해야한다.

  2. 일부 문자가 "열렸습니다"라는 문제가 있습니까? 나는 그들이 폐쇄 된 지역이 아니라는 것을 의미한다.

  3. cv::matchtemplate을 사용하는 경우 모든 문자에 대해 24 개의 템플릿이 필요하며 모든 숫자에 대해 10 개의 템플릿이 필요합니까? 그런 다음 내 이미지를 반복하여 최상의 상관 관계를 결정하십시오.

  4. 글자와 사각형이 모두 1 픽셀 너비이면 열려있는 문자를 닫으려면 어떤 필터/작업을해야합니까? 나는 여러 가지 조합의 확장과 침식을 시도했는데 효과가 없었습니다.

+0

링크를 보내는 대신 이미지를 업로드 할 수 있습니까? 링크에 '** 안전한 연결을 제공 할 수 없습니다 **' –

+0

형태학 ** 폐쇄 **를 시도 했습니까? [HERE] (https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_morphological_ops/py_morphological_ops.html#morphological-ops) –

+0

예.를 참조하십시오. 그러나 편지의 일부는 틀과 연결됩니다. 그리고 나는 이것이 좋은 일을하지 않을 것이라고 생각합니다. –

답변

0

"오픈 CV로 OCR을 어떻게 수행합니까?" 대답은 관련 프로세스이며 매우 어렵다는 것입니다.

그러나 일부 포인터. 첫째, 윤곽이 잡힌 편지를 찾기가 어렵습니다. 대부분의 도구는 글자가 가득하도록 설계되었습니다. 그러나 특정 크기 임계 값을 사용하여 모든 루프를 채우는 경우 문자가없는 비틀어 짐이 하나만있는 것처럼 보이는 이미지가 표시됩니다. 거대한 연결 대상이기 때문에 문자가 아닌 줄을 제거 할 수 있습니다.

글자를 채우면 골격화 될 수 있습니다.

세부 사항이 1 픽셀 너비 인 이미지에서는 열기 및 닫기와 같은 형태소 분석을 매우 유용하게 사용할 수 없습니다. 작업을 통해 이미지를 넣을 수는 있지만 모든 피쳐가 하나의 픽셀 인 경우 기본적으로 디테일과 노이즈가 구분되지 않습니다. 그러나 일단 편지를 채우면 그 문제는 사라집니다.

이 방법을 사용하여 포인터를주는 방법이 아닙니다. 다음

1은 두 번째 방법을 사용하지만 반대 결과가 아니라 당신이 보여있는 하나를 수행 할 수 있도록 작성 문자에 더 잘 작동합니다 말콤 OCR로 이전 답변에서 언급 한 바와 같이

0

. 2 연결된 구성 요소 레이블 지정 실행 OCR 알고리즘을 실행할 수있는 각 구성 요소에 대해 3

검색된 문자 사이의 공간적 관계를 사용하려고 시도합니다. 그들은 다른 문자를 가로 또는 세로로 나란히 판매했습니다.

행운을 빕니다