2013-11-28 3 views
0

색인을 생성하기 위해 SOLR 4.6을 사용하고 있으며 저장된 html 파일이 많습니다. http 또는 curl을 통해 SOLR에 이러한 파일을 추가하려고했지만 시간이 많이 걸립니다.HTTP를 통해 Solr에 html을 제출하는 방법

누구나 SOLR에 직접 색인을 생성 할 파일을 제출하는 방법을 알고 있습니까? 내 SOLR을 실행중인 서버에이 파일이 있습니다.

답변

0

Okke Klein이 제공 한 대답은 훌륭하지만 복잡합니다.

나는 내가 = local_file_path

예 HTTP를 통해하지만 옵션 stream.file 사용하여 파일을 제출하고있는 문제에 대한 가장 간단한 해결책을 발견 : -

curl http://localhost:8080/solr/update/extract?stream.file="+file.getPath()+"&literal.id="+id+"&commit=true 
0

DIH을 사용하여 모든 파일의 색인을 생성 할 수 있습니다. 내용을 정리하려면 HTMLStripTransformer도 있습니다.

+0

이 내가 쉽게 발견 구현하는 더 복잡하다 아래에 설명 된 방법 –

관련 문제