2014-11-17 3 views
0

입력 문자열과 주어진 문자열 모음 사이의 유사도를 계산하려고합니다. 해밍 거리와 거리를 사용하는 예제를 보았습니다. 그러나 이것들은 단지 두 번의 발언만을 고려합니다.문자열 집합 간의 유사도 비율

내 질문 : 위의 계산을 여러 번 할 수 있습니다. (저장된 문자열 집합이 있는데 새로운 입력 신호가 생겨서 비슷한 오래된 문자열이 새 문자열에 얼마나 비슷한 지 또는 일치하는 90 %의 문자열이 있는지 알고 싶습니다.) 나는 모든 문자열이 같은 길이이기 때문에 beleive hamming distance가 적절할 것입니다.

예 : 가정 입력하십시오 T T는 C G C T

  Existing: A A T T G T C 
        A C T T G T C 
        C A T T G T C 

많은 유사한 질문에 대답이 있지만, 나는 고려이 소요 하나를 찾을 수 없어. 어쩌면 누군가가 도울 수 있습니다.

미리 감사드립니다. , levenshtein

확인 문서 예를하는 것이 도움이 s의 희망 :

+0

왜 sql 태그를 넣으시겠습니까? –

답변

0

이 사용할 수 있습니다.