2017-12-06 4 views
0

이것은 스택 오버플로에 처음입니다. 소중한 정보를 제공하고 서로 돕는 데 감사드립니다.Apache solr은 업로드 된 실제 파일을 저장할 수 있습니까?

현재 Apache Solr 7에서 작업 중입니다.이 질문을 여기에 넣는 시간이 적으므로 완료해야하는 POC가 있습니다. 내 Windows 컴퓨터에 SOLR을 설치했습니다. 나는 핵심을 만들고 PDF UI/update/extract를 사용하여 PDF 문서를 업로드했습니다. 업로드 한 후 관리자 UI에서 쿼리 단추를 사용하여 쿼리하면 파일의 메타 데이터를 볼 수 있습니다. 나는 PDF의 actusl 내용을 얻을 수 있는지 궁금 해서요. 나는 하나의 tlog 파일이/data/tlog/tlog000 아래에 생성된다는 것을 알 수있다. 실제 PDF 파일은 아니지만 실제 파일과 함께있다.

질문은 입니다. 1. PDF 콘텐츠를 가져올 수 있습니까? 2. Solr이 실제 파일을 어딘가에 저장합니까? a. 그것이 저장하는 경우 어디에서합니까? b. 저장하지 않으면 파일을 저장할 수있는 방법이 있습니까? 뮤니 쉬 아 로라

답변

1

SOLR 것이다 상처가 아니라 실제 파일 어디서나

감사합니다. 설정에 따라 바이너리 콘텐츠를 저장할 수 있습니다. 추출 요청 처리기 사용 Apache Solr은 Apache Tika [1]를 사용하여 문서 [2]에서 내용을 추출합니다.

그래서 원하는 경우 pdf의 내용과 다른 많은 메타 데이터를 검색하고 반환 할 수 있습니다.

[1]

[2] https://lucene.apache.org/solr/guide/6_6/uploading-data-with-solr-cell-using-apache-tika.html

+0

https://tika.apache.org/ 내 의심을 지우기 위해 당신에게 알레산드로 베네 데티 감사드립니다. – Munish

관련 문제