자연 언어로 작성된 쿼리가 주어지면 해당 쿼리에서 키워드를 추출하여 IR 시스템에 제출하는 자연 언어 쿼리 전처리 모듈을 구현하려고합니다.자연 언어 쿼리 전처리
처음에는 용어의 TF-IDF 값을 계산하고 이러한 값을 단일 단어의 중요성을 평가하는 데 사용하는 교육 세트를 사용하는 방법에 대해 생각했습니다. 그러나 두 번째 생각에이 시나리오에서는이 의미가 없습니다. 훈련 컬렉션 만 있지만 IR 데이터에 대한 색인을 생성 할 수는 없습니다. 그러한 추정에 IDF 값만 사용하는 것이 합리적일까요? 아니면 다른 가중 접근법일까요?
이 문제를 해결하는 방법을 제안 해주세요. 일반적으로 읽은 NLP 처리에 관한 기사는 교육 및 테스트 데이터 세트에 대해 이야기합니다. 그러나 쿼리 및 교육 데이터 만 있으면 어떻게됩니까?
"키워드"와 "정보 검색 시스템에 제출"이란 정확히 무엇을 의미합니까? – oopcode
Google과 같은 정보 검색 시스템에서 검색어가 결과를 반환하면 자연어로 작성된 검색어에서 가장 중요한 단어를 추출하여이 검색어를 순서대로이 검색어 시스템의 새로운 검색어로 사용하고 싶습니다. 더 나은 결과를 얻으려면 ... – Smajl