0

post과 유사하게 동일한 질문을하고 다른 제안 및 아이디어가 있는지 확인하고 싶습니다.문서 이미지에서 텍스트 영역을 제거하는 방법은 무엇입니까?

문서 이미지 (신문)가 주어지면 사진을 추출하거나 텍스트 영역을 제거하는 방법은 무엇입니까?

저는 텍스트를 인식 할 필요가 없으므로 전통적인 OCR 방법이 적합하지 않을 수 있다고 생각합니다. OCR은 정확하고 느리지 않습니다. 텍스트 영역 (즉, 텍스트 블록)과 이미지 영역은 이미지 처리에서 몇 가지 임계 값 기반 방법으로 구분할 수 있어야한다고 생각합니다. OpenCV의 모든 제안이나 예제 코드는 높이 평가 될 것입니다. 감사합니다.

BTW 배경색이 흰색이 아니거나 특정 블록의 배경색이 흰색이 아닌 경우는 어떻습니까?

이미지 예 :

enter image description here

+0

이미지에서 직사각형을 감지 해 볼 수 있습니다. 노이즈로 인해 사각형의 크기에 대한 처리를 수행하십시오. 이 링크는 좋은 출발점이 될 수 있습니다. https://github.com/Itseez/opencv/blob/master/samples/cpp/squares.cpp – ssh99

+0

질문을하기 전에 제공된 답변에 무엇이 잘못 되었습니까? – runDOSrun

+0

http://chris.improbable.org/2013/08/31/extracting-images-from-scanned-pages/을 잘보아야합니다. 원하는 작업을하고 이미지에서 테스트하고 좋은 결과를 얻을 수 있으며 기초를 이해하는 데 도움이 될 수 있습니다. – runDOSrun

답변

0

OCR 입력으로 신문을 나던. 텍스트 영역을 먼저 찾아야합니다. 그래서 그것은 참으로 무의미합니다. 텍스트 영역을 찾으려면 적응 적 임계 값 (tutorial)을 사용하여 이미지를 이진화 한 다음 연결된 구성 요소로 획 폭 변환을 사용하여 균일 한 텍스트 영역을 찾습니다. 이 백서, swt을 참조하십시오. 이미지를 찾으려고 노력하는 것이 더 힘들 것 같습니다. 텍스트에도 비해 공간 주파수가 적지 만 별개의 기능이 일부 있습니다.

관련 문제