두 단어가 많은 두 개의 문자열이 있습니다.두 텍스트 파일 간의 단어 일치 비율 알고리즘
내 임무는 두 문자열 사이의 단어 일치 비율을 찾는 것입니다. 누군가 나에게 정확한 백분율/일치 단어를 얻기 위해 이미 알고리즘을 제안 해 줄 수 있습니까?
예 : 아래와 같은 방법을 사용할 수 있습니다
1. Mason natural fish oil 1000 mg omega-3 softgels - 200 ea
2. Mason Vitamins Omega 3 Fish Oil, 1000mg. Softgels, Bonus Size 200-Count Bottle
**Output** should be 8 words matched between two strings.
어떻게 복제본을 처리 하시겠습니까? 두 개의 예제 문자열에서'fish '가 두 번 나타난 경우 어떻게 카운트에 영향을 줍니까? –
문장을'tokenize'하고 나서'contains()'같은 것을 사용하여 단어를 diff합니까? 너 무슨 .. 시도 했어? –
"이미 가지고있는"알고리즘이란 무엇입니까? – nicovank