2011-11-29 4 views
3

내가 원하는 것이 가능한지 모르겠지만, 이것은 다음과 같습니다.비교할 텍스트의 해시를 생성하는 방법이 있습니까?

문구가 몇 개 있다고 가정 해 봅시다. 텍스트를 나타낼 수있는 문구를 줄 이도록 만들고 싶습니다. 나는 많은 원본을 위해 이것을 적용 할 것이다. 그 후 결과 문자열을 비교하여 서로 다른 텍스트가 얼마나 다른지 확인합니다. 내가 어디에 알 필요가 없습니다

내가에만 문자열을 비교하기 위해 필요의 차이 또는 원래의 문자열을 검색 할 수 있습니다. 이런 일이

있다? 나는 해결책을 복잡하게 만들고있다?

+0

당신의 측정 **를 원하는 경우에 얼마나 ** 해시 당신이 원하는 아니라, 두 문자열 사이가 차이. –

+0

@OliCharlesworth 예, 해시가 아니지만 비슷한 것입니다. –

답변

4

이 같은 기술이다 퍼지 해시라고합니다. ssdeep을 살펴보십시오. 또한 Identifying almost identical files using context triggered piecewise hashing이라는 종이에 관심이있을 수 있습니다.

관련 문제