2010-04-30 4 views
2

그래서 이진 파일 내용을 기반으로 고유하고 합리적인 길이의 파일 이름을 생성하는 알고리즘이 있습니다. 바이너리 내용이 동일한 두 파일의 이름이 같아야합니다. 분명히 이것에는 한계가있을 것입니다. 아마도 소수의 대다수 위치에서만 큰 파일 세트의 각각에 대해 고유 한 합리적인 길이의 파일 이름을 가질 수 없기 때문입니다. 그러나 아마도 예를 들어 일반적인 이미지 파일의 알려진 속성을 악용하는 등의 경험적으로 가장 좋은 근사치가있을 것입니다. 만약 내가 이것을 할 수있는 몇 가지 알고리즘의 이름이 있다면 나는 그것을 구글과 다른 접근법을 찾을 수 있습니다.파일 내용에 기반한 파일 이름

답변

5

MD5 hash 파일의 내용을 사용하십시오.

+0

해싱 - 오른쪽. 감사합니다. – Mark

+0

실제로 FreImage 라이브러리를 사용하여 jpg 또는 png 파일을 생성하기 위해 비트 맵에서이 파일을 생성했습니다. 이러한 파일이 이미 그러한 해시 된 식별자로 내부적으로 태그 지정되는 기회는 무엇입니까? – Mark

+0

FreeImage Library – Mark

2

MD5는 체크 아웃 할 가치가 있다고 생각합니다. 물론 콘텐츠가 동일하면 동일한 결과를 얻을 수 있지만 고유 한 콘텐츠를 얻을 때까지는 늘릴 수 있습니다.

+0

그게 내가하고 싶은거야 - 같은 내용에 대해 같은 이름을 지어 라. – Mark

+0

그러면 MD5가 정확히 필요한 것입니다. 그것의 소스 코드를 찾기가 어렵지 않다. 또한 md5 해시를 제공하는 작은 명령 줄 도구를 찾을 수있을 것이라고 확신한다. – m0s

+0

물어 보면 너희가받을 것이다. -이 포럼은 훌륭하다. (어떤 종류의 해싱이 나에게 일어 났음에 틀림 없다.) – Mark