2013-07-14 3 views
1

solr을 사용하여 만든 인덱스 크기 (메모리 사용량)를 대략 계산하려면 어떻게해야합니까? 계산에 들어가는 많은 변수가 있지만 10GB인지 10MB인지 여부 만 알면 알 수 있습니다. 나는 1000 개 문서가 예를 들어Solr 인덱스 크기를 대략적으로 계산하는 방법

, 필드에만 ID텍스트과 필드 유형이 문자열이나 text_general을 할 것인지 결정합니다. 다른 필드를 추가하면 크기가 어떻게 바뀝니 까?

아마도 anybode가 정말 감사하고 실제 인덱스에 대한 통계를 작성하면 될지도 모릅니다.

+0

인덱스 크기는 메모리 사용량과 다릅니다. 인덱스 크기는 Solr 인덱스가 차지하는 디스크 공간의 양이며, 메모리 사용은 쿼리 및 인덱싱 작업을 기반으로하는 다양한 요소에 따라 달라집니다. – arun

+0

'text'가 문자열인지 또는 text_general 필드인지 결정하는 것은 쿼리 요구 사항에 따라 다릅니다. 'string'은 어떤 분석도없이 값을 그대로 저장하기 때문에'text' 유형보다 공간이 덜 필요합니다. – arun

답변

1

SOLR 인덱스 크기 필드의 수는

  • 이러한 필드의 구성 요소 정의

    1. 의 수에 의존 할 것이다 여기서 인덱스 또는 저장된다. 저장된 필드는 일반적으로 인덱스 증가를 야기합니다.
    2. 필드에 정의 된 유형 및 필드 유형. 예 : 문자열 필드는 전체적으로 저장됩니다. 그러나 텍스트 필드는 필드에서 수행되는 분석 유형에 따라 여러 개의 토큰을 생성합니다. 예 : 에지 그램, n 그램, 동의어 등을 사용하면 여러 토큰이 생성되고 저장된 경우 인덱스에 유지 관리됩니다.
    3. 색인을 생성 할 필드의 내용입니다. 생성 된 토큰이 더 일반적이며 고유하지 않은 경우 Lucene이 토큰 사전을 별도로 저장하고 문서의 토큰에 대한 포인터 만 가지고 있으면 작은 인덱스 크기를 갖게됩니다.
    4. 위치

  • 및 훨씬 더를 사용하지 않을 경우 위치를 유지하는 것은 매우 비싼 색인 크기 때문에이를 방지 할 수 있습니다.

    관련 문제