2016-08-27 4 views
1

다른 Parquet 스키마와 다른 Cassandra 테이블 레이아웃을 분석/비교하고 있습니다.Cassandra로 최소 저장 디스크 크기를 계산하십시오.

출력 중 하나는 디스크의 저장소 크기입니다.

저는 Cassandra에게 공평하다는 것을 확신하고 싶습니다. 그래서 스냅 샷이 삭제되고 압축이 "완전히"실행되도록하고 싶습니다.

내 데이터는 초기에 마루에 있었고 Spark SQL로 읽었으며 Spark-Cassandra Connector를 사용하여 C *에 쓰는 큰 데이터 프레임을 가지고 있습니다.

스냅 샷을 삭제하고 압축을 실행 한 다음 내 테이블의 디스크 크기에 정확한 숫자를 얻으려면 어떤 유형의 "명령"을 실행해야합니까 (가정 해 말하면 nodetool)?

답변

1

nodetool clearsnapshot을 실행해야합니다.

이 명령은 nodetool 명령이 가리키는 노드에서 스냅 샷을 제거합니다. 따라서 각 노드에서이 작업을 수행해야합니다.

https://docs.datastax.com/en/cassandra/3.x/cassandra/operations/opsBackupDeleteSnapshot.html?hl=clearsnapshot

+0

감사

https://docs.datastax.com/en/cassandra/3.x/cassandra/tools/toolsClearSnapShot.html

, 실제로 그 첫 번째 단계. 압축이 모두 완료되었는지 어떻게 확인합니까? 'nodetool compactionstats'를 실행하는 것만 큼 쉽게 할 수 있습니까? –

+0

압축이 모두 완료되었는지 확인하는 유일한 방법은'nodetool compact' 명령을 실행하는 것입니다. –

관련 문제