similarity

    1

    1답변

    어떻게 파이썬을 사용하여 데이터베이스 테이블의 레코드에 levenshtein 거리를 구현합니까? 파이썬을 데이터베이스와 연결하는 방법을 알고 파이썬으로 코딩하는 것은 문제가되지 않을 수도 있습니다. 또한 데이터베이스 테이블에 레코드가 있습니다. 이론과 levenshtein 거리의 동적 프로그래밍을 이해합니다. 여기서 문제는 데이터베이스 테이블에 연결 한 후

    36

    3답변

    문장 쌍에 대한 의미 론적 유사성 점수 계산을위한 라이브러리가 있습니까? 워드 넷의 의미 론적 데이터베이스에 대해 알고 있고, 2 단어에 대한 점수를 어떻게 생성 할 수 있는지에 대해서는 알고 있지만, 포트 스템 핑, 단어 제거 등의 모든 사전 처리 작업을 수행하는 라이브러리를 찾고 있습니다. 전체 문장을 읽고 두 문장의 관련성에 대한 점수를 출력합니다.

    1

    1답변

    나는 음악 장르로 구성된 거대한 데이터베이스 테이블을 가지고있다. 거의 35000 기록 대부분은 주로 예를 들어, 같은 장르를 표현하는,이 위치 : +-----------+ | Name | +-----------+ | "Dubstep" | | Dub Step | | Dubstep | | dub-step | | dubstep | +------

    0

    1답변

    나는 두 단어 목록을 가지고 있는데, 나는 java API이 나에게이 단어들 사이의 유사점을 주길 원합니다. 예를 들어 역 문서 빈도를 계산하는 또는 벡터 공간 모델

    4

    1답변

    Lucene에서 비슷한 문서를 기록하고 싶습니다. 내 시나리오를 설명해 드리겠습니다. 예를 들어 색인을 작성한 파일에 다음 레코드가 있다고 가정 해 보겠습니다. 내가 "홍길동" 를 검색 할 때 ID|First Name|Last Name|DOB 1 |John |Doe |03/18/1990 1 |John |Twain |03/18/1990 3 |J

    1

    1답변

    웹 사이트에 대한 감지기를 구현하려고합니다. 이를 위해 두 개의 HTML 파일 간의 유사성을 비교하는 Java로 도구를 개발해야합니다. URL과 JS를 제거하여 별도로 처리하려고합니다. 웹 사이트의 중요한 변경 사항을 감지하기 위해 유사성 측정 항목 (백분율 이상)을 계산하는 데 사용할 수있는 도구/라이브러리/알고리즘을 찾고 있습니다. 도움 주셔서 감사합니

    1

    2답변

    좋아요. 개체 배열을 가지고 있습니다. 각 객체에는 픽셀로 된 x 및 y 좌표의 벡터가 있습니다. 나는 효과적으로 서로를 비교하고 서로를 비교하고 그들이 동일하다고 말할 필요가있다. (길이가 다양하므로 각 지점마다 몇 개의 픽셀 차이가있을 수 있습니다.) 내가 지금까지 해왔 던 작업은 실제로 효과적으로 작성되었습니다. 현재 루프 주변의 상자를 선택하고 미래

    0

    1답변

    파일에서 입력을 읽고 LIN, Banerjee 및 Pedersen Measure (BNP), Jiang and Conrath Measure (JNC)와 같은 단어 기반 유사성/각 줄에있는 단어들. synsets=[] for entry in line1: synsets.append(wn.synsets(entry)[0]) 을하지만이 나에게 corr

    0

    1답변

    사전 추출 후 키워드 추출 시스템에서 작업하고 있습니다. 동일한 패턴으로 일치하는 텍스트를 확인하여 후보 키워드를 추출합니다. 이제 추출 된 후보 키워드 사이의 유사성을 찾는 방법을 알고 싶습니까? k1 k2 k3 k1 1 ?1 ?2 k2 ?1 1 ?3 k3 ?2 ?3 1 how can I find the values of (?) ???

    4

    2답변

    나는 약 100M 개의 숫자 벡터 (Minhash 지문)를 가지고 있으며 각 벡터는 0에서 65536 사이의 100 개의 정수를 포함하고 있으며 Jaccard similarity을 사용하여이 지문 데이터베이스에 대해 빠른 유사성 검색을 수행하려고합니다. 쿼리 벡터 (예 : [1,0,30,9,42, ...])는이 쿼리 집합의 교차/합집합 비율을 100M 집합