lucene

    1

    1답변

    자바에서 lucene를 사용하여 여러 개의 PDF 파일에 대한 콘텐츠 검색을 수행 할 수 있지만 내 요구 사항은 여러 PDF 파일 콘텐츠를 검색하는 방법입니다 하기 위해서. indexer.index(pdfIndexItem); :와 인덱스에 추가, 그것을가 Indexer을 만든 후에, 그리고 File pdfFile = new File("src/resour

    0

    1답변

    우리는 lucene 2.4.0을 사용하고 있습니다. 다른 많은 분야는 검색 쿼리에 포함되어 있기 때문에 내가 MultiFieldQueryParser을 사용하고 : 일부 천 문서 도구는 파일 시스템 많은 다른 분야와 함께 두 필드 인덱스 아래 에 인덱싱됩니다. EffectiveDate="1970-01-01T00:00:00-05:00" Expirati

    0

    2답변

    여기 쌍의 키/값 색인 문서는 수입 후 내 문서는 MongoDB의 출신 : documents": [ { "uid": [ 1 ], "body": [ "" ], "field_section": [ { "nid": "3" } ],

    0

    1답변

    간단히 말해서, 하위 인덱스 판독기에 상대적인 문서 만 제공하는 CustomScoreProvider.CustomScore 메서드에서 문서의 실제 문서 ID를 확인하려고합니다. 추가 정보 : 미리 계산 된 부스트 요인 (Lucene의 문서 ID를 매핑하여 요소를 늘리는 메모리 내장 구조)을 생각해 내 문서의 점수를 높이려고합니다. 불행히도 필자는 몇 가지 이

    0

    1답변

    Lucene의 색인 생성 방법을 확인했습니다. 그러나 핵심 가치 쌍을 색인화해야합니다. 마찬가지로 하나의 파일 또는 몇 개의 파일에 많은 (단어, 문장) 조합이 있습니다. 대부분의 경우 단일 파일에 있습니다. 검색 할 때 사용하는 단어를 기준으로 문장을 검색하고 싶습니다. Java와 함께 사용해야하는 메커니즘은 무엇입니까? Hadoop의 시퀀스 파일과 비슷

    0

    1답변

    내 웹 사이트 키워드 검색에 Nutch 및 Lucene (java API)을 사용하고 있습니다. 내 문제는 Nutch가 원하는 키워드가 포함 된 모든 페이지를 할당 할 수 없다는 것입니다. 예를 들면. 나는 "Luxury Bag"이라는 제품을 가지고 있습니다. "Luxury"로 검색하면 결과에 제품을 얻지 못하고 "Luxury Bag"으로 찾으면 찾았습니다

    0

    1답변

    Java 지원에서 Lucene을 사용하여 단어 지원 및 확신을 계산하고 싶습니다. 나는 500이 .txt 문서를 통해, 그리고 ArrayList에 두 용어, 용어 i와 용어 J The formula for counting Confidence Dti-tj/Dti Dti-tj: Total document contains term i,term j Dti

    0

    1답변

    색인을 생성하고 일부 파일에서 키워드를 검색하는 Java 프로그램이 있습니다. filestoindex 디렉토리에 10 개의 파일이 있으며 해당 파일의 색인을 생성하고 있습니다. 처음으로 IndexWriter을 실행하면 10 개의 문서가 색인 된 것을 보여주고 있지만 다음에 색인을 생성하면 20 개의 문서가 색인 된 것을 보여줍니다. 이 때마다 이것을 방지하

    0

    1답변

    다중 값 필드가있는 문서의 색인을 생성했습니다. 특정 값이 하나만있는 문서를 검색해야하며이 값이 반복되는 경우에도이 값만 검색해야합니다. 발견에 문서의 예 : 찾을 수 없습니다 문서의 <doc> <arr name="source"> <str>X</str> </arr> </doc> 예 : <doc> <arr name="source">

    1

    2답변

    lucene을 사용하는 IDE에서와 비슷한 "Find in Files"을 구현하고 싶습니다. 기본적으로 .c, .cpp, .h, .cs 및 .xml과 같은 소스 코드 파일에서 검색하려고합니다. 아파치 웹 사이트에 표시된 데모를 시도했습니다. 이 파일은 행 번호 및 해당 파일에서 발생 횟수가없는 파일 목록을 리턴합니다. 나는 그것을 얻을 수있는 몇 가지 방법