2013-04-30 1 views
1

나는 cassandra로 시작하고 필자는 내 컬럼 계열의 디스크 크기를 알고 싶다. 내가 검색하고 내가 명령 발견 : nodetool-h localhost-p 7199 cfstats아파치 카산드라 : nodetool-h localhost-p 7199 cfstats

Column Family: client 
    SSTable count: 3 
    Space used (live): 281774148 
    Space used (total): 281774148 
    Number of Keys (estimate): 1010176 
    Memtable Columns Count: 0 
    Memtable Data Size: 0 
    Memtable Switch Count: 0 
    Read Count: 0 
    Read Latency: NaN ms. 
    Write Count: 0 
    Write Latency: NaN ms. 
    Pending Tasks: 0 
    Bloom Filter False Postives: 0 
    Bloom Filter False Ratio: 0,00000 
    Bloom Filter Space Used: 3752864 
    Key cache capacity: 200000 
    Key cache size: 0 
    Key cache hit rate: NaN 
    Row cache: disabled 
    Compacted row minimum size: 216 
    Compacted row maximum size: 310 
    Compacted row mean size: 310 

을하지만 결과를 이해하지 못하는, 그래서 당신은 나를 도울 수 있습니까?

답변

3

실제 사용되는 공간은 '사용 된 공간 (총)'입니다. 이것은 바이트 단위로 측정됩니다.

'사용 된 공간 (실제)'의 값은 사용중인 파일 (SSTables)에만 해당됩니다. 압축하는 동안 병합중인 파일의 사용되지 않는 부분이 삭제 될 수 있으므로 '사용 된 공간 (총)'보다 작을 수 있습니다. 압축이 끝나면이 중복을 삭제할 수있게되며 '사용 된 공간 (총)'이 줄어 듭니다.

이 모든 숫자는 노드마다 있습니다. 총 사용량을 원할 경우 각 노드의 cfstats 출력에 대한 숫자를 합합니다.

+0

감사합니다.하지만 SSTable 개수 = 3 인 이유를 설명해 주시겠습니까? 의미는 무엇입니까 ??? – chicchoc88

+0

그것이 데이터가 퍼져 나가는 파일의 수입니다. 별로 중요하지 않습니다. 더 많은 데이터를 삽입하면 점차적으로 올라갈 것입니다. 압축이 완료되면 줄입니다. 매우 큰 경우가 아니라면 일반적으로 걱정할 필요가 없습니다. – Richard

+0

내 계산이 정확하다면 내 열 가족의 크기 = 33,59Mo :(이점은 무엇입니까? 왜냐하면 내가 MySQL에 동일한 csv를 삽입했기 때문에 = 7,5156Mo 임) – chicchoc88

관련 문제