2010-01-14 2 views
-1

바이너리 파일 X를 다른 바이너리 파일의 디렉토리와 비교하고 X와 가장 유사한 다른 파일을 찾고 싶습니다. 동일한 청크가 파일 사이에 존재하지만 위치가 바뀔 수 있습니다. 파일의 크기는 모두 1MB이며 약 200 개가 있습니다. 나는 현대 데스크탑 컴퓨터에서 몇 분 안에 이것들을 분석 할만큼 충분히 빠른 것을 원합니다. 나는 조금 봤 거든 몇 가지 다른 바이너리 diff 유틸리티를 발견,하지만 그들 중 아무도 내 응용 프로그램에 적합한 것.가장 근접하게 일치하는 바이너리 파일을 찾는 유틸리티 또는 라이브러리

예를 들어 크기에 최적화 된 패치 파일을 만드는 것처럼 보이는 bsdiff가 있습니다. 또는 차이점을 그래픽으로 표시하는 vbindiff이지만, 실제로는 한 파일이 다른 파일보다 X와 더 유사하다는 것을 알지 못합니다.

이 목적으로 직접 사용할 수있는 도구가 없다면 누군가 내 유틸리티를 작성하는 데 추천할만한 좋은 라이브러리가 있습니까? 파이썬이 더 좋지만 유연합니다.

답변

관련 문제