0
입력 문자열과 주어진 문자열 모음 사이의 유사도를 계산하려고합니다. 해밍 거리와 거리를 사용하는 예제를 보았습니다. 그러나 이것들은 단지 두 번의 발언만을 고려합니다.문자열 집합 간의 유사도 비율
내 질문 : 위의 계산을 여러 번 할 수 있습니다. (저장된 문자열 집합이 있는데 새로운 입력 신호가 생겨서 비슷한 오래된 문자열이 새 문자열에 얼마나 비슷한 지 또는 일치하는 90 %의 문자열이 있는지 알고 싶습니다.) 나는 모든 문자열이 같은 길이이기 때문에 beleive hamming distance가 적절할 것입니다.
예 : 가정 입력하십시오 T T는 C G C T
Existing: A A T T G T C
A C T T G T C
C A T T G T C
많은 유사한 질문에 대답이 있지만, 나는 고려이 소요 하나를 찾을 수 없어. 어쩌면 누군가가 도울 수 있습니다.
미리 감사드립니다. , levenshtein
확인 문서 예를하는 것이 도움이 s의 희망 :
왜 sql 태그를 넣으시겠습니까? –