2017-02-01 2 views
0

Solr 5.3.1을 실행 중입니다. "y field가 'bar'와 같은 곳에 'field x를'foo '로 설정하는 것과 같은 Solr 인덱스를 업데이트하려고합니다. 그러나 Solr은 질의에 의한 업데이트를 수행 할 능력이없는 것처럼 보입니다. 그래서 나는 이것을 달성하기 위해 SolrJ를 사용하는 코드에 의지했다.Solr 원자 업데이트가 이전 업데이트를 삭제합니다

로직은 Solr에게 쿼리를 만들어 업데이트하려는 결과를 가져온 다음 원자 업데이트 (http://yonik.com/solr/atomic-updates/ 참고)를 사용하여 개별 문서를 업데이트합니다. 나는 원자 업데이트 매우 기괴한 행동을 얻을

public void updateDocsByQuery(String queryStr, String fieldName, String fieldValue) 
     throws Exception { 

    SolrDocumentList docList = fetchDocsByQuery(queryStr, "id" , 5000); 

    if (!docList.isEmpty()) { 
     Collection<SolrInputDocument> docs = new ArrayList<>(); 

     for (int i=0; i<docList.size(); i++) { 
      SolrDocument doc = docList.get(i); 
      String id = (String) doc.getFieldValue("id"); 

      SolrInputDocument inputDoc = new SolrInputDocument(); 
      inputDoc.addField("id", id); 
      Map<String, Object> fieldMod = new HashMap<>(1); 
      fieldMod.put("set", fieldValue); 
      inputDoc.addField(fieldName, fieldMod); 

      docs.add(inputDoc); 

     }      

     client.add(docs); 
     client.commit(); 
    }    
} 

처럼

내 코드 보인다. docList의 마지막 문서 만 값으로 업데이트되고 나머지 문서는 삭제됩니다. 다른 쿼리로이 코드를 다시 실행하면 이전 실행에서 업데이트 된 문서도 삭제되고 다시 목록의 마지막 문서 만 업데이트됩니다.

누구나이 이상한 행동을 이해합니까?

내 스키마는

<schema name="MySchema" version="1.5"> 
<fields> 
    <field name="_version_" type="long" indexed="true" stored="true"/> 
    <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 

    <field name="title" type="text_en" indexed="true" stored="true" multiValued="false" termVectors="true" termPositions="true" termOffsets="true" /> 
    <field name="subject" type="text_en" indexed="true" stored="true"/> 
    <field name="author" type="text_en" indexed="true" stored="true"/> 
    <field name="keywords" type="text_en" indexed="true" stored="true"/> 
    <field name="category" type="text_en" indexed="true" stored="true"/> 
    <field name="suggested_links" type="string" indexed="true" stored="true" /> 
    <field name="resourcename" type="string" indexed="true" stored="true" docValues="true" /> 
    <field name="resource_names" type="string" indexed="true" stored="true" multiValued="true" docValues="true" /> 
    <field name="content_type" type="string" indexed="true" stored="true" docValues="true"/> 
    <field name="last_modified" type="date" indexed="true" stored="true"/> 
    <field name="source_group" type="string" indexed="true" stored="true" /> 

    <!-- Main body of document --> 
    <field name="content" type="text_en" indexed="true" stored="true" termVectors="true" termPositions="true" termOffsets="true" /> 

    <!-- catchall field, containing all other searchable text fields (implemented via copyField further on in this schema --> 
    <field name="text" type="text_en" indexed="true" stored="false" multiValued="true" /> 

<!-- holds Solr dedupe hash code --> 
<field name="dedupeSignatureField" type="string" indexed="true" stored="true" multiValued="false" /> 

<!-- copy fields to search by default in our catch-all field, 'text' --> 

<copyField source="title" dest="text"/> 
<copyField source="subject" dest="text"/> 
    <copyField source="author" dest="text"/> 
    <copyField source="keywords" dest="text"/> 
    <copyField source="content" dest="text"/> 

</fields> 

<uniqueKey>id</uniqueKey> 

<types> 

    <fieldType name="string" class="solr.StrField" sortMissingLast="true" /> 
    <fieldType name="date" class="solr.TrieDateField" precisionStep="0" positionIncrementGap="0"/> 
    <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/> 
    <fieldType name="text_en" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer type="index"> 
      <tokenizer class="solr.StandardTokenizerFactory"/> 
      <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="lang/stopwords_en.txt" 
       /> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.EnglishPossessiveFilterFactory"/> 
      <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
      <filter class="solr.PorterStemFilterFactory"/> 
      </analyzer> 
      <analyzer type="query"> 
      <tokenizer class="solr.StandardTokenizerFactory"/> 
      <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
      <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="lang/stopwords_en.txt" 
       /> 
      <filter class="solr.LowerCaseFilterFactory"/> 
      <filter class="solr.EnglishPossessiveFilterFactory"/> 
      <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
      <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> 
    </fieldType> 
</types> 

여기에 코드 SOLR 5.4.0에서 작업하는 동안 나는 또한이 문제에 직면

+0

스키마를 붙여 넣을 수도 있습니까? – stephanruhl

답변

0

를 입력합니다. docList의 마지막 문서 만 값을 사용하여 업데이트되었지만 나머지 문서는 삭제되었습니다.

내 솔루션, 코드에서 대체 :

inputDoc.addField("id", id); 

inputDoc.setField("id", id); 

과 훼손되지 않은 코드의 나머지 부분을 남겨주세요.

관련 문제