2014-01-29 3 views
0

exampledocs 디렉토리의 일부 XML 파일에 캡션을 추가하고 싶습니다. 예를 들어, manufacturers.xml 파일에는 <doc> 태그에 11 행의 데이터가 포함되어 있지만 거의 모든 테이블에는 캡션이 있습니다. "표 1. 개인 소비자 구매시 무료 재활용을 제공하는 컴퓨터 제조업체 목록 ... ".solr에 캡션 추가하기 XML exampledocs

새 필드 이름 = "캡션"을 추가하고 11 회 반복 (매우 길 수도 있음)하거나 Solr에서 제목을 추가하는 더 좋은 방법이 있습니까?

답변

0

'caption'이라는 필드를 샘플 문서에 넣고 싶다면 거기에 그 필드를 추가해야합니다 (그런 필드를 추가하는 다른 방법이 있지만 훨씬 더 많은 작업이 필요합니다. 그것을 추구한다).

는 등 일부 테이블을 DB를이 인덱스에 필요한 경우 그냥 확인하려면 format

에서보세요하지만, SolrJ와 프로그래밍 방식으로 그 일을 다른 다이 하이드로을 사용하여, 또는 이동하는 일반적인 방법 api. 그거 알아?

편집 : 귀하의 코멘트를 읽고 ... 다음 PDF 파일로 자막과 함께, DIH and Tika

+0

없음 데이터베이스에 단지 과학적인 테이블을 보일 것입니다, 엑셀, 워드, 텍스트, HTML 및 기타 형식. 행을 가져올 수는 있지만 항상 파일에있는 제목을 처리하는 가장 좋은 방법은 확실하지 않았습니다. –