여기에이 질문을 게시해야 할 것인지 말 것인지를 모릅니다. 하지만 누군가가 그것을 안다면, 대답 해주십시오.이미지의 텍스트 및 그래픽 영역을 결정하는 중
이미지의 어느 영역이 텍스트이고 어떤 것이 그래픽인지를 결정하는 알고리즘은 무엇입니까? 그러한 지역을 분리하는 방법을 의미합니까? (그림 또는 다이어그램)
여기에이 질문을 게시해야 할 것인지 말 것인지를 모릅니다. 하지만 누군가가 그것을 안다면, 대답 해주십시오.이미지의 텍스트 및 그래픽 영역을 결정하는 중
이미지의 어느 영역이 텍스트이고 어떤 것이 그래픽인지를 결정하는 알고리즘은 무엇입니까? 그러한 지역을 분리하는 방법을 의미합니까? (그림 또는 다이어그램)
대부분의 OCR 소프트웨어 (예 : Ocropus)는 필요한 레이아웃 분석을 지원합니다.
Mao, Rosenfeld & Kanungo (2003) Document structure analysis algorithms: a literature survey은 레이아웃 분석 알고리즘에 대한 최근 조사를 제공합니다.
첫 번째 단계는 아마도 텍스트와 이미지 사이의 더 선명한 대비를 분리하는 것입니다. 이것은 이미지의 파생물을 취함으로써 수행 될 수 있습니다. 그러면 색상의 변화가 표시되고 높은 값은 텍스트 모양과 비교 될 가능성이 높습니다.
이미지 자체에 대한 자세한 내용을 지정하십시오. 사진이 있습니까? 스캔 한 문서입니까? 컬러/흑백? – Gilad
스캔 된 문서 이미지입니다. 그리고 어떤 이미지라도 주어질 수 있습니다. 우선이 이미지를 이진 이미지로 변환 한 다음 작동합니다. – avd