2010-12-01 8 views
1

OCR을 위해 스캔 한 문서 이미지의 약간 색이 짙은 배경을 자동으로 제거해야합니다.스캔 한 문서에서 배경/전경 레이어 분리

ScanTailor은 다른 것들 중에서 배경 분리를 수행하는 오픈 소스 C++ GUI 기반 응용 프로그램이지만 실제로 배경을 제거하는 마지막 단계 만 실행하는 방법을 알아낼 수 없습니다. 는 C++의 경우에만 해당 이미지에 해당 단계를 수행, 라인 실행을 명령에 응답하려면 수정 C#

    1. 포트 부분 :

      적으로는, 내가이와 하나를 수행하는 코드를 찾을 수

    내가 어떻게 할 수 있는지 이해할 수 있도록 도와 줄 수 있습니까?
    또는이를 수행 할 수있는 다른 라이브러리를 알고 계십니까? (수용 가능한 언어/플랫폼)

  • 답변

    3

    OCR 응용 프로그램에 필요한 임계화, 얼룩 제거 및 노이즈 제거 기술을 언급하고 있습니다. 사용 된 원 스캔 품질 이미지 해상도 배경 색상과 패턴의

    인쇄 품질 -

    결과의 품질은 매우 여러 가지 요인에 따라 달라집니다. 소음 및 기타 표시.

    http://www.hi-components.com/nievolution.asp에있는 IEvolution.NET 라이브러리가 유용 할 수 있습니다. 그것은 많은 이미지 프로세싱 기능을 가지고 있습니다.

    상용 엔진이 많이 있습니다. 이미지 프로세싱 문제를 해결할 수있는 완벽한 기능은 없습니다. 이미지와 일치하도록 함수와 매개 변수를 조정해야합니다. Adaptive threshold Binarization's bad effects

  • fast threshold and bit packing algorithm (possible improvements ?)
  • Adaptive threshold binarization: post-processing for removing ghost objects
  • Best threshold for converting grayscale to black and white
  • http://www.recogniform.com/thresholding.htm

      는 구글 검색 결과에 많이 나타납니다.

    1

    어쩌면 알고리즘은 대략이다

    • 배경색이
    • 화소 가진 색상 (및/또는 충분히 비슷)의 비트 맵을 스캔 무엇인지 결정 배경색
    • 이 픽셀을 흰색 또는 투명색으로 변환하십시오.
    • 아마도 배경색이지만 다른 다른 배경 픽셀 옆에없는 격리 된 픽셀은 무시하십시오.

    색상이 고해상도 인 경우 (예 : 흑백) 이미지를 사용하는 경우이 알고리즘을 groups of pixels에 적용해야합니다.

    +0

    어떻게 격리 된 픽셀을 쉽게 무시할 수 있습니까? 기본적으로 노이즈 이미지를 고려해보십시오. 일종의 노이즈 제거도해야합니다. 나머지는 팬케이크입니다. –

    관련 문제