2015-01-06 2 views
0

사용자 입력 (태그)을 기반으로 텍스트 파일 (비 구조적 데이터)을 수집해야하므로 모든 파일에서 태그 용어를 검색해야합니다. 발견되면 나는 검색어가 발생한 단락을 반환해야합니다. 예를 들어자바를 사용하여 태그 지정하여 데이터 추출

: 두 가지 색상 을 그들이 사용할 수있어 루피 5490.의 가격 블루투스 지원

ABX 이어폰이 인도 시장에 출시 된 다음과 같은 내용을 가지고 spec.txt 파일 검은 색과 빨간색을 선택할 수 있으며 제공된 마이크로 USB 케이블을 통해 충전식 배터리를 사용할 수 있습니다.

ABX는 완전히 충전 된 후 재생을 최대 10.5 시간까지 렌더링 할 수 있다고합니다. 또한 음성 통화에 참석할 수있는 통합 마이크 이 있습니다. 이어폰에는 잡음 제거 기술과 Bluetooth 수신기/커넥터가 디지털로 제공됩니다 ( ). 상기 2 개 단락

, 사용자가 태그를 입력하면, "가격"이 반환해야 "가격 = 루피 5490"또는 그것이 용어 "가격"

I 식별 단락을 돌려 UIMA와 Lucene에,하지만 어떻게이 작업을 수행하는 어떤 생각을 못하고, 누군가가 나를 도울 수 ..

+0

Lucene Highlighter를 사용해 보셨습니까? 전체 단락을 반환하지는 않지만 "가격"이있는 곳의 강조 표시된 내용을 반환합니다. – Rushik

+0

UR 답장을 보내 주셔서 감사합니다 ... 예, 해결책을 찾았습니다. solr 하이 라이터를 사용하고 있습니다. solr 응답으로 반환 된 스 니펫의 조각 크기를 조정하여 검색 조건이있는 단락을 얻을 수 있습니다. – Rajasekar

답변

0

통해 UR 회신 U 감사 사전에

감사합니다 ... 체크 한 그래 내가 SOLR를 사용하여 솔루션, 메신저 발견 형광펜을 사용하여 solr 응답으로 반환 된 스 니펫의 조각 크기를 조정하여 paragrap을 얻을 수 있습니다. h 검색 용어가 존재하는 곳