2017-09-08 2 views
-2

this app과 같은 디렉토리에 중복 이미지를 찾는 프로그램을 만들고 싶습니다. 두 이미지가 같은지 확인하는 알고리즘이 무엇인지 궁금합니다. 제안을 환영합니다.중복 이미지 찾기 알고리즘

+0

"중복"은 어떻게 정의합니까? 이미지가 동일해야합니까? 그들은 서로 다른 크기를 가질 수 있습니까? 이미지 파일 형식? 파일 속성? –

+0

예, 두 이미지의 크기와 파일 형식이 다를 수 있으며 두 이미지의 내용 만 동일해야합니다. –

답변

0

이 작업은 사용 케이스에 따라 고밀도 (kd-tree, ball-tree, ...)의 가장 가까운 이웃 검색을 담당하는 일부 데이터 구조와 결합하여 perceptual-hashing으로 해결할 수 있습니다. brute-force 검색을 대체하십시오 (다소).

이미지에는 DCT 기반, Wavelet 기반, 통계 기반, 기능 기반, CNN 등 다양한 방법이 있습니다.

그들의 디자인은 일반적으로 작업에 대한 서로 다른 가정에 기반합니다. 회전 허용 여부

A google scholar search on perceptual image hashing은 많은 논문을 나열합니다. 이미지 지문을 찾아 볼 수도 있습니다.

Here is some older ugly python/cython code doing the statistics-based approach.

비고 : Digikam도 그렇게 할 수 있습니다. 내가 생각하기에 좀 더 오래된 Haar-Wavelet 기반 접근법을 사용하고 있습니다.

+0

감사! 이것은 매우 도움이됩니다. –