2016-07-12 2 views
1

많은 이미지 파일이있는 폴더가 아주 많습니다. 때로는 스캔 한 문서 이미지가 우발적으로 폴더에 저장되고 다른 사람이 폴더를 시각적으로 스캔하지 못하는 경우가 있습니다.이 이미지는 감지되지 않고 잘못된 위치에 게시하면 문제가 발생할 수 있습니다.이미지 파일의 내용 감지 : 사진들 사이에서 스캔 한 문서 찾기

파일 유형에 따라 스캔 할 수 있었고 크기가 정품 이미지 범위에 광범위하므로 메타 데이터로 검색하기가 매우 어렵습니다.

누구나 도구 또는 프로그래밍 방식으로 정품 이미지에서 스캔 한 문서를 감지하는 방법을 알고 있습니까?

답변

4

Accord Framework : http://accord-framework.net/을 살펴 보는 것이 좋습니다. 컴퓨터 비전 기능을 확인하십시오. 나는 그것이 당신이 기술하고있는 일에 달려 있어야한다고 생각합니다. 게다가 그것은 배울 재미있는 새로운 영역입니다. 행운을 빕니다.

+0

많은 훈련 견본을 사용함으로써, 당신은 그 차이를 인식하기 위해 당신의 프로그램을 (어코드 또는 유사한 것을 사용하여) "가르 칠"수 있어야합니다. –

+0

아마도 이것이 최선의 방법이라고 생각합니다. 패턴을 충족하는 것으로 보이는 리뷰 이미지를 표시 한 다음 기계 학습을 통해 사람의 리뷰를 기반으로 패턴을 계속 정제 할 수 있습니다. – BlueChippy

1

스캔 한 문서가 이미지 처리 라이브러리에서 수행해야하는 문서처럼 보일 것이라고 가정합니다. 문서가 아닌 것을 정리하기 위해 몇 가지 기능을 선택하기 만하면됩니다. 이러한 기능을 사용하여 몇 가지 기본 분류 또는 기계 학습을 적용하십시오.

나머지 파일은 사람이 확인하거나 일부 ORC를 사용하여 확인할 수 있습니다. 간단한 분류보다 계산 시간이 오래 걸리기 때문에 모든 파일에 대해 OCR을 실행하지 않을 것입니다.

문서 (특히 기밀 문서)는 높은 주파수의 어두운 전경이있는 밝은 배경이있는 경향이 있습니다. 어두운 것들은 줄에 묶여 있습니다. 색상이 거의 없으며 색상이 보통 문서의 작은 부분 (로고 등)에만있는 경우 이러한 속성을 공유하는 많은 이미지를 생각할 수 없습니다.

귀하의 컬렉션에 많은 신문과 책 사진이 없으면 괜찮습니다.

물론 스캐너와 카메라는 서로 다른 이미징 속성과 광학 수차를 가지고 있으며 파일에서 일부를 찾을 수는 있지만 모든 이미지에서 작동하지는 않습니다. 특히 그 이미지가 더 큰 이미지에서 잘린 것이 아닙니다.

0

폴더에 다른 텍스트 온 배경 이미지가있을 수 있습니까? 이 스캔 한 문서에 큰 그림이 있습니까? 비 단순 이미지 건초 더미에서 텍스트 문서를 대부분 필터링하는 한 가지 방법은 Shannon (히스토그램) 엔트로피를 기반으로 이미지를 고화질로 전달하는 것입니다. 대부분의 이미지는 엔트로피 값이 단순한 문서보다 큰 순서입니다.