2011-09-08 3 views
0

파일 호스팅 웹 사이트에서 사용할 수있는 가장 좋은 해시 함수는 무엇입니까? 모든 파일에 대해 해시를 저장하고 싶습니다. 따라서 중복 된 파일을위한 HD 공간을 낭비하지 않아도됩니다.파일 호스팅 사이트의 해시 함수

sha1/md5는 큰 파일의 경우 속도가 느리고 예상 트래픽이 높습니다. 가장 좋은 솔루션은 무엇입니까? 네트워크를 통해 사용자로부터 파일을받는 동안 메모리에 해싱?

내 관심사는 사이트 성능입니다. 예상 트래픽이 높기 때문에 해싱이 병목 현상이 될 수 있습니다.

답변

0

대용량 파일의 경우 모든 해시는 디스크에서 파일을 읽을 수있는 속도에 따라 제한되므로 거의 동일한 속도로 실행됩니다. 일반적으로 설명하는 것과 같은 사이트는 CPU에서 실행되는 것이 아니라 디스크와 네트워크의 속도가 병목 현상을 일으 킵니다.

0

파일 호스팅 웹 사이트에서 사용할 수있는 가장 좋은 해시 기능은 무엇입니까?

SHA는 MD5보다 더 나은 해시입니다.

sha1/md5는 큰 파일의 경우 속도가 느리고 예상 트래픽이 높습니다. 가장 좋은 솔루션은 무엇입니까? 네트워크를 통해 사용자로부터 파일을받는 동안 메모리에 해싱?

내부 또는 외부 호스팅입니까? 내부 들어 클라이언트 측에 해시 것입니다. 얼마나 많은 파일이 중복 될지 추정 해 보셨습니까? 어쩌면 해싱에 아무런 이점도 없을 것입니다. CPU 사이클 낭비에 비해 공간을 절약 할 수 있습니다.

+0

SHA가이 응용 프로그램에서 MD5보다 좋지 않다는 것을주의 깊게 읽으십시오. 문제는 더 심각합니다. 이것은 보안을 위해가 아니라 중복을 탐지하는 것입니다. –

0

해시 공식에는 여러 가지가 있으며 가장 좋은 해결책은 사이트의 수명 기간 동안 예상되는 파일 수, 복제본을 몇 개 만들지는 얼마나 나쁜지, 얼마나 많은 CPU 당신이 해시 함수 등등에 전념 할 수있는 마력.

Here은 위키 백과에서 매우 흥미롭고 합리적인 충돌 특성을 제공해야하는 흥미로운 64 비트 해시 함수 중 하나입니다. 또한 해당 페이지에 링크 된 다른 해시 함수를 검사하십시오. 그 중 하나는 필요한 것일뿐입니다.