2012-09-10 2 views
0

문제 : 우리 cassandra의 데이터베이스는 많은 디스크 공간을 차지합니다. 예상 데이터 크기는 약 10Gb이고 디스크 공간은 약 100Gb입니다. 우리는 많은 쓰기/삭제를합니다. 두 개의 노드가 있습니다. 에 완료 되었으나 제로 효과 cassandra 디스크 공간 사용

  • 설정 gc_grace
  • 0으로 실행 수리 - 두 노드에

    1. 실행 압축 : 여기

      우리가 (순서가 이루어졌다)하려고 노력 무엇 두 노드 - 하나의 노드가 성공했고, 다른 노드는 성공했다 - 살아 있었지만 3 일 동안 지속되었다.
    2. 두 노드에서 압축 실행 - 완료되었지만 여전히 영향 없음.

    다른 사람이 도와 줄 수 있습니까? 우리는 다음에 무엇을해야합니까? :)

  • +1

    casssandra의 버전을 사용하고 계십니까? 카산드라에 어떻게 데이터를로드하나요? 얼마나 많은 삭제 작업을하고 있습니까? gc_grace가 0 인 카산드라에서 데이터를 삭제 한 후 두 번 압축을 시도 했습니까? – samarth

    +0

    - 우리는 cassandra v1.1.2를 사용합니다. -이 같은 hector 클라이언트를 사용합니다 (아래 답변 참조). - 평균 크기가 2MB 인 이진 문서의 경우 약 200 회/분 및 200 회 삭제/분 - 삭제하지 않았습니다. gc_grace = 0 인 경우 먼저 삭제 한 다음 gc_grace를 0으로 설정하고 복구를 실행 (노드 2 개 중 하나가 성공)하고 압축을 실행했습니다. – shutyaev

    답변

    0

    나는 카산드라 2.0.9와 비슷한 문제에 직면했다.

    모든 노드에서 nodetool clearsnapshot을 사용하여 HDD의 공간을 비우는 데 성공했습니다. 지정된 열 패밀리에 대해서만 스냅 샷을 제거 할 수 있습니다. nodetool 유틸리티 사용에 대한 세부 사항은 here입니다.

    관련 문제