0
더 나은 압축 기술을 선택하기 위해 노력하고 있습니다. bzip2으로 시도했지만 압축에 시간이 더 걸립니다.datameer, presto 및 spark와 같은 도구를 사용할 때 압축 기술이 더 잘 작동합니다.
더 나은 압축 기술을 선택하기 위해 노력하고 있습니다. bzip2으로 시도했지만 압축에 시간이 더 걸립니다.datameer, presto 및 spark와 같은 도구를 사용할 때 압축 기술이 더 잘 작동합니다.
질문에 대한 직접적인 대답이 없을 것입니다. 더 낫거나 옳은 것은 인프라, 요구 사항 및 데이터 흐름에 따라 달라집니다.
"Performance comparison of different file formats and storage engines in the Hadoop ecosystem"또는 "Hadoop Compression. Choosing compression codec."을 조사 할 수 있습니다.
속도의 관점에서 보면 Snappy이 좋은 시도 일 수 있습니다.