similarity

    1

    1답변

    나는 google-diff-match-patch C# 라이브러리를 사용합니다. 두 텍스트 사이의 유사성을 측정하고 싶습니다. 내가이 C# 코드 확인이 작업을 수행하려면 : - 100 0 사이 List<DiffMatchPatch.Diff> lDiffs = dmpDiff.diff_main(sTexte1, sTexte2); int iIndex = dmpDiff

    3

    1답변

    Hadoop을 사용하여 단어 사이의 동시 발생 유사성을 계산하고 있습니다. 그들 사이의 가장자리를 a b a c b c b d 내가 노드와 공동으로 발생하는 단어로 단어를 취급합니다 그래프 기반의 접근 방식을 사용하고 있습니다 : 내가 좋아 보인다 공동 발생하는 단어 쌍으로 구성 파일이 있습니다. 내 알고리즘은 모든 노드의 차수를 계산해야합니다.

    4

    2답변

    의 내가 다른 차원의 두 유사성 행렬을 가지고 다음과 같은 공통점이 자신의 row.names의 일부가 아니라 같은 순서로 가정 해 봅시다 : > m1 red yellow blue green black red 0.000000 2.236068 4.472136 6.708204 8.944272 yellow 2.236068 0.000000 2.23

    1

    2답변

    C#에서 int 배열을 가지고 있으며 새 배열에 가장 비슷한 유사한 값이 포함되는 방식으로 전체 배열의 5 %를 가져오고 싶습니다. 예를 들어, 40 개의 형제 중 20 개 (15-25)가 포함 된 100 개의 항목이있는 배열이 있다고 가정 해보십시오. 내가 원하는 것은 20을 가장 빈번한 값 (형제 포함)으로 새로운 배열로 그리고 5 개의 가장 빈번한 값

    3

    1답변

    나는 3 백만 행을 가진 테이블을 가지고 있습니다. 각 행은 5 가지 속성을 가진 객체를 나타냅니다. 각 속성 값은 부동 소수점과 범위는 0에서 1 표가 나는 특정 일에 처음 10 개 가장 유사한 개체를 찾을 수있다 CREATE TABLE tbl ( OBJECT_ID integer, property_1 float, property_

    1

    1답변

    데이터 집합에 고유 라이브러리가있는 유사성 행렬을 만들려고합니다. 방금 csv 파일을 고유 행렬로 읽었지만 matlab 고객으로 알고 있습니다. bsxfun 또는 유클리드 거리 계산에 의한 인스턴스 간의 거리를 정의하는 것과 같은 것을 찾고 있습니다. 솔루션이나 소스로 함수가 도움이 될 수있는 방법은 무엇입니까? 나? 귀하의 샘플을 가정

    4

    1답변

    Lucene의 MoreLikeThis (mlt) 과 FuzzyQuery (flt)의 차이점은 무엇입니까? 나는 Elasticsearch을 통해 두 쿼리 유형 (ES)를 평가하고 그리고 나는 그들이 개념적으로 매우 유사 발견 mlt : 다른 문서 '필드 대 flt와 기존 문서 필드를 비교 :의 비교 다른 문서의 필드가있는 문자열 그러나 flt의 성능은 mlt

    0

    1답변

    Matlab의 KNN 메소드를 통해 데이터 세트를 분류하고 싶지만 데이터 유형이 다른 데이터 포인트의 거리를 계산할 때 문제가 있습니다. 내 데이터 세트의 각 지점에는 숫자 및 문자열 유형이 포함되어 있습니다. X{Size,Lenght,Age,Coating,PipeType,Location} 처음 세 기능에는 숫자가 있고 세 번째 기능에는 문자열 (한두 단어

    1

    1답변

    웹에서 tf-idf와 코사인 유사성을 계산하는 파이썬 튜토리얼을 발견했습니다. 나는 그것으로 놀고 그것을 조금 바꾸려고 노력하고있다. 문제는 이상한 결과가 거의없고 의미가 거의 없습니다. 예를 들어 3 개의 문서를 사용하고 있습니다. [doc1,doc2,doc3] doc1과 doc2는 유사하며 doc3은 완전히 다릅니다. 결과 위치 :가 [[ 0.00000

    6

    1답변

    SQL Server 테이블이 있으며 각 제품에는 당사 웹 사이트에서 공개적으로 사용할 수있는 설명이 있습니다. 나는 설명이 다른 제품의 설명과 너무 유사 할 때 사용자를 예방하거나 적어도 경고합니다. 각 제품의 설명 길이는 크게 다를 수 있습니다. 서로 중복되거나 유사한 단락/텍스트 블록을 포함하는 설명이있는 제품에 대한 쿼리를 원합니다. Levenshte