2013-03-29 1 views
1

나는 solf를 사용하여 pdf 파일을 추출하고 색인을 생성합니다. 지금은 다음 코드를 추출 할 수 있어요 :solr pdf 추출이 작동하지만 색인 생성이 없음

private static void IndexPDFFile(ISolrOperations<Article> solr) 
{ 
    string filecontent = null; 

    using (var file = File.OpenRead(@"C:\\cookbook.pdf")) 
    { 
     var response = solr.Extract(new ExtractParameters(file, "abcd1") 
     { 
      ExtractOnly = true, 
      ExtractFormat = ExtractFormat.Text, 
     }); 

     filecontent = response.Content; 
    } 
    solr.Commit(); 
} 

하지만 브라우저에서 다음 명령을 SOLR을 확인할 때, 아무것도 표시되지 않습니다 :

http://berserkerpc:444/solr/select/?q=text:solr 

또는

http://berserkerpc:444/solr/select/?q=author:admin 

PDF 파일의 내용은 다음과 같습니다. Solr 요리 책입니다. 필드 작성자는 admin과 함께 somethinh를 포함해야합니다. 여기

출력 : 그 문제에 대한

<response><lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">1</int> 
<lst name="params"><str name="q">text:Solr</str></lst></lst><result name="response" numFound="0" start="0"/></response> 

어떤 제안 ?? 당신이 당신의 ExtractParametersExtractOnly=true을 설정했기 때문에

덕분에, 접근 금지

답변

1

이입니다. 다음은 소스 코드의 ExtractOnly 매개 변수에 대한 주석입니다.

/// <summary> 
    /// If true, return the extracted content from Tika without indexing the document. 
    /// This literally includes the extracted XHTML as a string in the response. 
    /// </summary> 
    public bool ExtractOnly { get; set; } 

추출 된 내용의 색인을 생성하려면이 매개 변수를 true로 설정하지 마십시오.

+0

위대한! 감사!!!!!! – tro