2012-11-10 2 views
0

원래 조각 별 해싱은 파일의 고정 크기 세그먼트를 사용하여 해시 값을 계산합니다. 그리고 문맥 트리거와 같은 조각 별 해싱이 조각 해싱을 사용하여 파일의 해시 값을 평가할 때 롤링 해시를 사용하는 것으로 나타났습니다.전통적인 조각 별 해싱에 비해 컨텍스트 트리거를 조각 별 해시를 사용하면 어떤 이점이 있습니까?

그리고 나는 전통적인 기술보다이 기술을 사용하는 것이 확실하지 않습니다.

답변

3

나는 "Context Triggered Piecewise Hashing"이라고 생각 하나?

ssdeep project은 Jesse Kornblum의 "컨텍스트 트리거 조각 별 해싱을 사용하여 거의 동일한 파일 식별"이라는 제목의 문서에 대한 링크입니다. 그 논문은 스팸 알고리즘의 형태로 CTPH의 기원과 목표를 다룹니다.

이 요약 : 전체 파일의 해시를 계산

  • 같은 sha1sum file을 실행하여, 당신은 파일의 전체 크기에 정비례 한 시간에 정확히 동일 파일의 쌍을 찾을 수 있습니다.

  • 조각 별 해싱을 위해 고정 크기 세그먼트를 사용하면 파일 중간에 바이트를 다시 쓰면 여전히 참조 파일과 동일하다는 것을 알 수 있습니다. 그러나 바이트가 삽입되거나 삭제되면 나머지 파일 전체에 대한 체크섬이 변경됩니다.

  • CTPH는 더 중요한 차이가있는 경우에도 파일 간의 유사성을 인식 할 수 있어야합니다. 변경 사항이 너무 크지 않으면 CTPH는 파일의 일부분을 삽입하거나 삭제할 수 있습니다. 이 논문은 파일의 첫 3 분의 1 또는 마지막 3 분의 1 만 주어진다면, 스팸이 아마도 그것이 어떤 파일인지 알 수 있다고 주장합니다.

관련 문제