두 개의 문자열 사이의 차이를 변경 모니터 시스템의 일부로 계량하려고합니다.큰 문자열의 빠른 근사 문자열 차이
내가 겪고있는 문제는 문자열이 대입니다. 나는 종종 100K + 문자로 문자열을 처리 할 수 있습니다.
저는 현재 Levenshtein 거리를 사용하고 있지만 큰 문자열의 경우 levenshtein 거리를 계산하는 것은 매우 비효율적입니다. 심지어 최상의 구현은 O(min(mn))
만 관리합니다.
두 문자열의 길이가 거의 같기 때문에 거리 계산 프로세스에 많은 시간이 걸릴 수 있습니다.
고정밀도는 필요하지 않습니다. 1000 (예 : 0.1 %)에서 1의 변경 해상도는 제 신청에 충분합니다.
더 효율적인 문자열 거리 계산을 위해 어떤 옵션이 있습니까?
Aaaand stackoverflow에는 mathjax가 없습니다. WTF? –
http://meta.stackexchange.com/questions/30559/latex-on-stack-overflow –
흥미로운 질문입니다! 행렬 만들기를 통해 levenstein 거리를 구현하고 있습니까? 그것은 느릴 수 있습니다. 이제 어떤 종류의 언어를 쓰지는 않았지만 각 문자열의 바이트 배열을 만들면 반복 할 수 있습니까? 당신이 숫자 'd'를 얻는 것만으로도 문자의 차이를 다룰 수 있다면 100k 반복이 상당히 빠르다는 것을 의미합니다. 그러나 당신은 더 낮은 시간의 복잡성을 얻을 수 없다고 생각하지만, 자바를 사용하면 일정한 메모리를 얻을 수 있습니다. –