큰 이미지 라이브러리에서 중복 제거를 찾으려면 스크립트를 작성하고 있습니다. 지금은 같은 크기의 파일을 먼저 찾은 다음 파일의 10240 바이트 부분에 sha256을 수행하여 동일한 크기 (코드 here)의 파일 지문을 얻는 두 단계 필터를 수행합니다.JPEG 내장 체크섬/지문?
잘 작동하지만 아마도 sha256 대신 jpeg 형식으로 체크섬이 내장되어있을 것입니다.
체크섬이나 지문처럼 작동하는 체크섬이 있는지 알고 있습니까? 그렇다면 효과적인 접근 방법이 있습니까?
비슷한 물건을 시도하는 사람 : SHA 제품군은 암호화 용도로 사용되며 이러한 유형의 응용 프로그램에 대한 불필요한 복잡성으로 인해 훨씬 간단한 CRC로 충분합니다 (그러나 MD5보다 복잡한 것은하지 않습니다). 결과 속도 향상은 임의로 선택된 10240 대신 전체 파일을 포함하는 데 사용될 수 있습니다. CRC가 정규화 된 크기 spezification (예 : 8 바이트)과 결합되면 두 번째 통과는 더 이상 사용되지 않습니다. – guidot