2010-02-19 3 views
2

나는 OCR 프로젝트를 가지고 있지만, 텍스트가 거꾸로 뒤집어지지 않은 상태에서 이미지가 잘 보이는 이미지에서만 효과가 있습니다. (회전하지 않은 텍스트) 그래서 OCR이 모든 종류의 이미지를 인식 할 수 있도록하고 싶습니다. 그러나 나는이 문제를 해결하기위한 접근 방식이 무엇인지 모른다.더 나은 OCR 결과를위한이 분석에 기초한 이미지의 분석과 변형

글자의 분석과 같은 것이 필요하지만, 그렇다고하더라도 줄이 거꾸로되어 있는지 여부를 식별 할 수는 없습니다.

답변

1

생각하지 않습니다 - 어떤 사람들은

제르 니케

Neocognitron neural network 순간을 사용하고 그것을 할 수 여러 줄에 많은 텍스트가있는 잡지 나 책은 페이지의 회전을 찾으려고 노력하는 것이 좋습니다.

아마 이렇게하는 가장 간단한 방법은 라인에 대한 해로우 변환을 적용하는 것입니다. 텍스트의 각 줄 사이의 빈 공간은 넓은 흰색 선이어야하므로 이미지의 사전 처리없이 작동 할 수 있습니다. 그렇지 않으면 텍스트를 흐리게 처리하거나 "닫기"형태의 작업을 사용하여 텍스트 행을 불투명 한 블록으로 만듭니다.

이미지에서 선을 변형을 사용하여 찾으면 회전의 주요 각도 (모든 선의 평균 각도와 같음)를 추출하고 다시 회전해야합니다.

1

내 대답은 당신이 상상할 수있는 것처럼 간단하지 않기 때문에 매우 높습니다. 텍스트의 각 문자를 구분하는 일종의 이미지 분할을 수행하고있을 것입니다. 그러나 문자를 인식하기 위해서는 회전 된 경우에도 회전 불변 특성을 가진 피쳐 벡터를 사용해야합니다. 널리 필기

에 사용 나는 당신이에 OCR을 수행하는 이미지에서 경우 간단한 작업

1

OCR 엔진을 만들거나 사용 중인지 확실하지 않습니다. 대부분의 상업용 OCR 엔진은 페이지가 거꾸로 (또는 90도 회전) 자동으로 회전하는지 감지 할 수 있습니다. 예를 들어, 우리 회사의 GlyphReader OCR Engine이 그렇게 할 수 있습니다.

간단한 해결책 중 하나는 이미지의 일부를 가져 와서 인식 된 텍스트를 다시 얻을 때까지 네 각도에서 엔진을 통해 실행하는 것입니다. 사전을 사용하여 돌아 오는 것이 단어와 신뢰 수준인지 여부를 확인하여 엔진이 얼마나인지를 확인할 수 있습니다.

엔진에서 신뢰도 수준을보고 할 수 있고 특정 임계 값 미만으로 일관되게보고하는 경우 문서가 회전되었는지 확인하고 중지해야합니다.

90 및 270의 경우, 이미지의 선이 가로 또는 세로인지 여부를 알려주는 변형이 표시됩니다. 또한 가로로 약간 회전 시켜도이를 보정 할 수 있는지 알려줄 수 있습니다.