2013-03-16 2 views
2

내 서버의 Linux 용 xampp에 Solr 3.6.2와 drupal 7을 설치했습니다. 나는 또한 SOLR 통합 모듈 apachesolr-7.x-1.1.zipApache Solr의 인덱싱과 관련한 일부 qns

1)을 설치 한 때 색인 파일을 말할 book.csv이 파일은 SOLR에 저장하기된다. (path_to 폴더 이름 ??)

2) 인덱싱 된 전체 파일과 인덱싱 된 파일 이름을 알고 싶습니까?

3) solr에 대한 쿼리 구문을 이해할 수 없습니까? q, wt, 무엇이 다양한 파서이고 각각의 함축적 의미입니까?

4) 색인이 생성 된 파일의 경로는 어떻게 찾습니까? 내가 색인을 생성 한 파일이 있다고 가정하고 쿼리 검색을 수행 할 때 사용자가 파일을 열어 볼 수 있도록 색인이 생성 된 파일의 경로 이름을 반환해야합니다.

+0

설명서에 나와있는 항목에 대한 구체적인 질문이 있으면 질문하십시오. http://wiki.apache.org/solr/ –

+0

나는 하나 더 qn을 가지고 있는데 그것은 내가 test.docx라고 말한 파일에 색인을 붙이고 나는 app 버전 = 5.6.2와 Customer = ABC tech와 같은 파일에 주석을 달았습니다. my curl stmt는 curl과 같아야합니다. http : // localhost : 8983/solr/update/extract? literal.id = 3 & literal.comment = 'APP VER = ABC 5.2.2, Customer = Microsoft, Date = 24 2013 년 3 월 '& commit = true "-F"[email protected] " 내 컬링이 맞습니까? –

+0

그리고 내 schema.xml

답변

3

1) 4) 업로드 된 파일이 문서로 분리됩니다. 문서는 이며, 인덱스는입니다. 이와 유사한 세계 책의 색인 량 : '상대성'은 '현대 물리학'의 'M'양, '아인슈타인'의 'E'양을 가리킬 수 있습니다. 또는 세금 브래킷으로 납세자를 분류하는 책.

이 동작은 storedindexed 스키마에 의해 제어됩니다.

데이터는 옆의 solr 디렉토리 data에 저장됩니다. 이 디렉토리를 복사하여 백업 할 수 있습니다.

2) http://wiki.apache.org/solr/CommonQueryParametershttp://wiki.apache.org/solr/SimpleFacetParameters. 특히 사용하십시오 fl

3) 스스로 해결해보십시오. 당신은 그것을 얻을 수 있으며 즉시 쿼리를 시도하십시오.

+0

필드에 comment라는 필드가 있습니다. companny의 연례 회보 같이 상상하십시오, pdf 파일을 색인이 붙였다. 색인을 생성 할 때 필드 텍스트는 = false를 저장했습니다. 그래서 그 필드와 함께 schema.xml 파일을 수정 한 후에 다시 색인을 생성해야합니까 ??? 나는 pdf의 내용을 얻기 위해 열심히 노력하고있다. 그러나 나는 pdf의 메타 데이터 만 얻는다. –

+0

다시 색인해야합니다. 그리고 Tika는 PDF를 텍스트로 줄입니다. – aitchnyu

+0

나는 위의 단계를 시도했지만 haven은 내 admin 페이지의 통계 페이지에있는 링크를 클릭하여 solr (http : // localhost : 8983/solr/admin/update/extract 쿼리 처리기의 통계 값 : 참고 : 아직 초기화되지 않았습니다. 이것은 무엇을 의미 하는가 ? coz 나는이 쿼리 처리기를 사용하여 PDF 파일의 색인을 생성했습니다. –