분산 된 환경에서 매일 50GB의 로그를 저장하는 데 문제가 있습니다. Hadoop HDFS를 살펴 봤지만 Windows 인프라, 다국어 파일 시스템 API가 부족하여 잘 작동하지 않는 문제가 있습니다. 반면 카산드라는 어떤 플랫폼에도 쉽게 설치할 수 있습니다. 내가 직면하고있는 유일한 큰 문제는 디스크 공간 사용이다. 여기 수치는 다음과 같습니다카산드라는 디스크 공간 사용의 관점에서 로그 저장에 충분합니까?
- 원래 로그 크기가 224MB 입니다
- 카산드라 데이터 파일은 557Mb 입니다
- 카산드라 인덱스 파일은에서 로그 라인을 저장할 때 그래서 거의 2 배의 오버 헤드를 가지고
109Mb입니다 로그 파일.
아주 간단한 시나리오에서 Cassandra를 어떤 방식 으로든 조정하여 디스크 공간을 많이 차지하지 않을 수 있습니까?
mamu (위키의 'Cassandra Limitations'페이지에서)를 참조하시기 바랍니다 http://stackoverflow.com/questions/2359175/cassandra-file-structure-how-are-the-files-used/2359282#2359282 – Schildmeijer