내 이미지 파일을 모두 저장하는 저장소가 있습니다. 중복 된 이미지가 많아서 중복 된 이미지를 하나씩 삭제하고 싶습니다.두 바이너리 파일이 정확히 같은지 확인하는 방법
각 이미지 파일의 체크섬을 생성하고 파일 이름을 체크섬으로 변경하면 파일 이름을 검사하여 복제 된 파일이 있는지 쉽게 확인할 수 있습니다. 그러나 문제는 사용할 체크섬 알고리즘을 선택할 수 있는지 확신 할 수 없다는 것입니다. 예를 들어, MD5를 사용하여 체크섬을 생성하는 경우 체크섬이 동일하여 파일이 정확히 동일하다는 것을 정확하게 신뢰할 수 있습니까?
"당신이 정말로 편집증이라면 약간 더 낫습니다"라고 말하면서 감사합니다 :) 감사합니다. –
SHA-1은 MDB가 128 비트 인 반면 SHA-1은 160 비트입니다. 따라서 SHA-1의 결과는 더 독특 할 것이지만 계산은 약간 더 오래 걸립니다. 해시를 원한다면 SHA-256과 같은 것을 사용할 수 있습니다. SHA-256은 더 길며 계산 속도가 더욱 느려집니다. – neelsg