현재 우리는 사용자가 추가 한 텍스트를 유형 mediumtext로 저장하고있는 웹 사이트를 운영하고 있습니다.MySQL - 두 필드를 비교하여 퍼센트로 일치합니다.
현재 Google 시스템은 텍스트가 일치하는지 확인하고 1 : 1 (100 % 같음 - 한 개의 공백으로 새 텍스트로 간주 됨) 일 때 true를 반환합니다.
우리는 더 똑똑한 시스템을 만들려고 노력하고 있습니다. 내용이 얼마나 동일한 지 (퍼센트로) 퍼센트로 표시 할 수 있어야합니다. 불행히도 우리는 좋은 진전이 없습니다. 우리가 생각할 수있는 거의 모든 알고리즘은 올바르게 작동하지 않았거나 매우 느리고 무거웠습니다.
우리는 누군가가 우리에게 부스트를 줄 수 있기를 바라고 있습니다.
참고 : 바이트를 비교하려고했지만 상황이 제대로 작동하지 않았습니다.
편집 : 우리는 MySQL에만 국한되지 않습니다. 우리는 아파치 solr 서버에서 찾고있었습니다. 장점이 있다면이 방향이나 사건에 도움이 될만한 것을 제공하십시오.
당신이 봤어 (http://dev.mysql.com/doc/refman/5.5/en [전체 텍스트 검색?] //fulltext-search.html) – Kermit
예, 만족하지 못했습니다. 퍼센트로 콘텐츠를 일치시키는 데 대한 아이디어가 있습니까? – kanevbgbe