stemming

    0

    1답변

    Lucene 4.0에서 PorterStemFilter 클래스를 사용하는 방법에 대한 도움을 찾고 있습니다. 다음은 내 인덱서 http://www.lucenetutorial.com/lucene-in-5-minutes.html에서 가져온 것입니다 : ... StandardAnalyzer analyzer = new StandardAnalyzer(Version.L

    1

    1답변

    하나의 TextField에 lucene 문서를 저장했습니다. 줄기가없는 단어가 포함되어 있습니다. 사용자가 단어와 정확한 단어를 검색 할 수있는 검색 프로그램을 구현해야합니다 (예 : ). 형태소 분석없이 단어를 저장하면 스템 검색을 수행 할 수 없습니다. 두 필드를 저장하지 않고도 문서에서 정확한 단어 및/또는 형태소 분석 단어를 모두 검색 할 수있는 방

    4

    1답변

    프로젝트 작업 중이고 주어진 단어의 근원을 알아야합니다 (형태소 분석). 아시다시피 사전을 사용하지 않는 형태소 분석 알고리즘은 정확하지 않습니다. 또한 WordNet을 시도했지만 프로젝트에 좋지 않습니다. phpmorphy 프로젝트를 찾았지만 API는 Java에 포함되어 있지 않습니다. 현재 데이터베이스 또는 다른 형식의 영어 단어 텍스트 파일을 찾고 있

    0

    1답변

    나는 사용자 정의 스톱 단어 필터링을 기본 형태소 분석과 결합하기 위해 SnowBallAnalyzer을 사용했지만 이전 버전에서는 더 이상 사용되지 않습니다. 예 : 인덱스 구성에, 난 쉽게 지정할 수 있습니다 : IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_32, new

    -1

    1답변

    보통 우리는 원본 텍스트를 저장하고 줄기 텍스트 및/또는 원래 텍스트를 Solr에 색인화합니다. 줄기 내용을 solr에 저장할 가능성이 있습니까? 내 목표는 solr에 쿼리 할 때 텍스트의 줄기 버전을 얻는 것이기 때문에. 사전에 감사합니다, 아르노

    2

    1답변

    페르시아어 텍스트 용 텍스트 분류에 weka를 사용하고 싶습니다. 그러나 나는 문제가있다. 페르시아어의 Tokenizer, stoplist 및 stemmer는 영어와 다릅니다. 그래서 나는 스태머, tokenizer 및 stoplist를 weka의 인터페이스에 사용해야합니다. 내 자신의 stoplist를 사용하는 것은 영혼이지만, 줄기와 tokennizer

    0

    2답변

    포터 알고리즘과 같은 단어 형태소 분석 알고리즘을 살펴 봤지만 지금까지 입력으로 파일을 처리 한 모든 것을 다뤘습니다. 줄임표에 문자열을 단순히 전달하고 줄기가있는 문자열을 반환하도록하는 기존 알고리즘이 있습니까? 같은 뭔가 : String toBeStemmed = "The man worked tirelessly"; Stemmer s = new Stemm

    1

    1답변

    Oracle 10g에서 Oracle Text를 사용하고 있습니다. 나는 다음과 같이 여러 열로 CONTEXT 인덱스를 만들었습니다 내 테이블입니다 CREATE TABLE WEB_RES ( "ID" NUMBER(10,0), "TITLE" VARCHAR2(256 BYTE), "DESCRIPTION" VARCHAR2(1024 BYTE

    1

    1답변

    다운로드 한 페이지에 대해 KrovetzStemmer를 구현하고 싶습니다. 내가 가진 가장 큰 문제는 단순히 주어진 문서와 함께 body().text()을 사용할 수 없다는 것입니다. 그런 다음 모든 단어를 줄입니다. 그 이유는 내가 전혀 줄기가 없어야하는 href 링크가 필요하기 때문입니다. 그래서 내가 href 링크를 가지고 몸을 얻을 수 있다면 hre

    1

    1답변

    3 일 동안이 문제가 발생하며 해결책을 찾을 수 없습니다. Weka 개발자 에디션 (3.7.10)을 사용하여 NetBeans 7.3으로 DM 어플리케이션을 개발 중입니다. 나는 눈덩이 형태소 분석기를 사용하기 위해 노력하고있어 나는 순간에 내 응용 프로그램을 실행하는 동안은 내가 가진 형태소 분석기를 만들 때와 같은 예외가 계속 : SnowballStemm