2013-02-24 2 views
1

나는 하나의 노드 elasticsearch 클러스터를 가지고 있으며 여기에 path.data:/partone,/parttwo와 같은 쉐이더를 저장할 두 개의 경로로 구성한다. 1 GB 하드 디스크는/partone 폴더에 마운트되었고 5 GB 하드 디스크는/parttwo 폴더에 마운트되었습니다. 인덱스에 약 483MB의 파일을 사용하고 536644 개의 문서가이 노드에 나타납니다./partone 폴더의 홀 파일을 제거하면 워드 프로세서 수가 531833이되었습니다. 이는 일부 워드 프로세서가/partone 폴더에 저장되었음을 의미합니다.패스를 설정할 때 elasticsearch에 파편을 저장하는 방법 (path.data)?

나는 elasticsearch 웹 사이트에서 다음과 같이 읽었습니다. 여러 데이터 위치에서 스트라이프 할 수 있습니다. 스트라이핑은 간단하며 전체 파일을 위치 중 하나에 배치하고 가장 큰 여유 공간이있는 위치를 기반으로 파일을 배치 할 위치를 결정합니다.

그리고 내 질문은 스트라이핑이 가장 큰 여유 공간이있는 위치를 기반으로하는 경우 홀 파일은 partone 폴더보다 크기가 큰 parttwo 폴더에 저장해야합니다. 그렇지 않습니까? 왜 folderone에 작은 파일이 있습니까?

답변

0

인용 한 단락은 실제 Lucene 색인을 참조합니다. ES가 복제를 수행하는 방법과 관련된 세부 정보가 있으며이 정보는 작은 드라이브에도 저장 될 수 있습니다. ES가 Lucene으로 데이터를 플러시 할 때 제거됩니다. 예를 들어, -Des.path.data=/d/data/foo,/tmp/foo으로, 몇 분에 대한 인덱싱 위키 피 디아 후와 -XPOST /_flush 수행, 나는 참조 :

% du -ks /d/data/foo /tmp/foo 
205680 /d/data/foo 
776  /tmp/foo 
% df -h /d/data/foo /tmp/foo 
Filesystem      Size Used Avail Use% Mounted on 
/dev/sda5      294G 28G 251G 10% /d 
/dev/disk/by-uuid/074cc648... 106G 91G 11G 90%/

내가 /partone에서 일부 파일을 삭제 한 후 당신이 계산 할 수 있었다, 그러나, 놀랍군요 문서들. /tmp/foo을 삭제 한 후 색인이 작동하지 않았습니다.

관련 문제