큰 데이터 (수백만 줄)로 작업하고 있습니다.gzip 파일에 줄 단위로 쓰기
나는이 줄을 생성하는 COTS 스크립트를 가지고 있으며 내용별로 다른 파일에 줄을 주석 처리해야합니다. 순수 텍스트로 된 파일의 크기 때문에 gzip 형식으로 직접 데이터를 쓸 수 있다면 이상적입니다.
e.e. 때문에 파일 크기와 라인 카운트 극한의 다시
line_generator | while read line; do
[[ $line =~ .*0/0.* ]] && { echo "${#line}," | gzip -9 >> REF.out.gz ; }
[[ $line =~ .*0/1.* ]] && { echo "${line}" | gzip -9 >> MAT.out.gz ; }
[[ $line =~ .*1/0.* ]] && { echo "${line} | sed 's/X/y/g'" | gzip -9 >> MAT.out.gz ; }
done
는, 나는 내가 GZIP'ped 파일에 덤프 아웃하기 전에 먼저 메모리에있는 파일을 구축 할 수 있습니다 모르겠어요.
즉석 압축 파일 시스템을 사용하십시오. gzip 압축을 사용하는 btrfs. –