fuzzy-search

    1

    1답변

    문장을 파싱해야합니다. 이제 Earley 파서와 문법을 구현했습니다. 문장의 철자가 틀리면 모든 것이 잘 작동합니다. 하지만 문제는 내가 처리해야하는 문장이 많이 시끄 럽다는 것입니다. 구문 분석과 오류 수정을 결합한 알고리즘이 있는지 궁금합니다. 가능한 오류는 다음과 같습니다 오타 'cheker'대신 '검사'의 오타 대신 '맞춤법 검사기'의 '맞춤법 검사

    5

    2답변

    수십억 줄의 텍스트와 몇 백만 개의 "키워드"가 있다고 가정 해 보겠습니다. 작업은이 줄을 훑어보고 어떤 줄에 어떤 키워드가 들어 있는지 확인하는 것입니다. 즉, (K1 -> V1) 및 (K2 -> V2)의지도가 주어진 경우 K1=lineID, V1=text, K2=keywordID 및 V2=keyword 인 경우 (K2 -> K1)의지도를 작성하십시오.

    3

    2답변

    나는 현재 일하는 웹 앱에 퍼지 검색 기능을 구현하고 싶다. 백엔드는 Java로되어 있으며 모두가 여기에 추천하는 검색 엔진 인 Lucene도 Java로 코딩되어 있습니다. 그러나 나는 여러 가지 이유로 그것을 사용하는 것을 꺼리고있다 : 나는 내 자신의 무언가를 짓는 것을 성취했다고 느낄 것이다. Lucene에는 내가 사용하지 않는 수많은 기능이 있습니다

    0

    1답변

    그래서 백과 사전 기사 나 책과 같은 매우 큰 문장의 배열을 상상해보십시오. 기본적으로이 배열을 검색하고 지능적으로 - Google 검색과 같은 종류의 일치하는 키를 반환합니다. 즉, 단어가 입력에서 잘못되었거나 문자열에 존재하지 않는다는 것을 의미합니다. 나는 이것을 달성하는 여러 가지 방법을 생각할 수 있지만, 미리 만들어진 함수 (클래스가 없으면 제발

    0

    1답변

    작동 알고리즘을 만들었지 만 실행 시간은 매우 끔직합니다. 예, 처음부터 그것은 끔찍할 것이지만 그 정도는 아닙니다. 200,000 개의 레코드 만 들어도이 프로그램은 1 시간 이상 실행됩니다. 기본적으로 내가 무엇을하고 있는가하는 것입니다 : for each searchfield in search fields for each sample in s

    14

    2답변

    결과를 반환하지 않는 "jahngir"~ 0.2에 대한 퍼지 검색을 수행하려고합니다. 내 색인에는 "JAHANGIR RAHMAN MD"데이터가 포함되어 있습니다. 정확한 단어 "jahangir"~ 0.2를 사용하여 검색을 시도하면 작동합니다. 누가 잘못했는지 누군가가 도와 주시겠습니까? Solr 퍼지 검색이 어떻게 작동하는지 파악하려고 많은 시간을 보냈습니

    2

    1답변

    나는 Postgres를 사용하여 퍼지 검색을 만들려고 노력하고 있으며 django-watson을 기본 검색 엔진으로 사용하여 작업을하고 있습니다. 검색 할 모델의 모든 필드 값을 포함하는 tsvector라는 search_tsv라는 필드가 있습니다. 필자는 텍스트 필드에서 원하는 것을 정확히 수행하는 Levenshtein 함수를 사용하고 싶었습니다. 그러나,

    3

    1답변

    매우 복잡한 쿼리가있는 인덱스가 있습니다. 주요 둔화는 각 레코드에 대해 2-5 단어를 포함하는 필드에 대해 실행되는 퍼지 쿼리입니다. 나는 주로 1-3 개의 다른 문자로 행을 찾아야합니다. 내 4 코어 (HT 포함) 및 8GB 램 시스템에서 내 쿼리는 약 1-2 초마다 실행됩니다. 12 코어 (HT 포함) 및 72Gb RAM이있는 서버에서 쿼리는 0.3-

    1

    2답변

    저는 Solr에 초보자이며 SolrNet으로 전체 텍스트 검색을 원합니다. 그래서 전에 MySql 전체 텍스트 검색을 사용했고 매우 느리게 진행됩니다. Solr 솔루션을 찾았습니다. 이것은 매우 빠르고 확장 성이 뛰어납니다. 하지만 나는 솔라에서 퍼지 검색을 할 수 없다. 내가 어떻게 할 수 있니? 아래에 나와있는 나의 예와 목표. 실로 영어를 용서하고 충

    0

    1답변

    로컬 시스템에 Solr 인스턴스가 있고 브라우저의 관리 인터페이스를 통해 액세스하고 있습니다. Solr의 인스턴스는 비 퍼지 검색을 위해 올바르게 작동합니다 (매일 광범위하게 사용함). 데이터베이스의 레코드 하나는 forename 필드 Barnaby와 성 필드 Dawson이 있습니다. 또 다른 레코드는 Marcus Downing으로, 적절한 이름과 성 필드