자바를 사용하여 태그 지정하여 데이터 추출

사용자 입력 (태그)을 기반으로 텍스트 파일 (비 구조적 데이터)을 수집해야하므로 모든 파일에서 태그 용어를 검색해야합니다. 발견되면 나는 검색어가 발생한 단락을 반환해야합니다. 예를 들어자바를 사용하여 태그 지정하여 데이터 추출

: 두 가지 색상 을 그들이 사용할 수있어 루피 5490.의 가격 블루투스 지원

ABX 이어폰이 인도 시장에 출시 된 다음과 같은 내용을 가지고 spec.txt 파일 검은 색과 빨간색을 선택할 수 있으며 제공된 마이크로 USB 케이블을 통해 충전식 배터리를 사용할 수 있습니다.

ABX는 완전히 충전 된 후 재생을 최대 10.5 시간까지 렌더링 할 수 있다고합니다. 또한 음성 통화에 참석할 수있는 통합 마이크 이 있습니다. 이어폰에는 잡음 제거 기술과 Bluetooth 수신기/커넥터가 디지털로 제공됩니다 ( ). 상기 2 개 단락

, 사용자가 태그를 입력하면, "가격"이 반환해야 "가격 = 루피 5490"또는 그것이 용어 "가격"

I 식별 단락을 돌려 UIMA와 Lucene에,하지만 어떻게이 작업을 수행하는 어떤 생각을 못하고, 누군가가 나를 도울 수 ..

출처

2015-01-06 Rajasekar

Lucene Highlighter를 사용해 보셨습니까? 전체 단락을 반환하지는 않지만 "가격"이있는 곳의 강조 표시된 내용을 반환합니다. – Rushik

UR 답장을 보내 주셔서 감사합니다 ... 예, 해결책을 찾았습니다. solr 하이 라이터를 사용하고 있습니다. solr 응답으로 반환 된 스 니펫의 조각 크기를 조정하여 검색 조건이있는 단락을 얻을 수 있습니다. – Rajasekar

통해 UR 회신 U 감사 사전에

감사합니다 ... 체크 한 그래 내가 SOLR를 사용하여 솔루션, 메신저 발견 형광펜을 사용하여 solr 응답으로 반환 된 스 니펫의 조각 크기를 조정하여 paragrap을 얻을 수 있습니다. h 검색 용어가 존재하는 곳

출처

2015-01-08 07:16:36 Rajasekar

자바를 사용하여 태그 지정하여 데이터 추출

답변

관련 문제