저는 파일이 많으며, 각각 1000MB 파일을 가지고 있으며 각각 4MB를 가지고 있습니다. 완전히 4GB가 있습니다. INPUT_UNSORTED가 1000 개 파일을 추가하여 만든 큰 파일입니다유닉스 정렬을 할 때 디스크 사용을 최소화하십시오.
sort -t ',' -k 1,1 -k 5,7 -k 22,22 -k 2,2r INPUT_UNSORTED_${current_time}.DAT -o INPUT_SORTED_${current_time}.DAT
: 나는 유닉스 정렬을 사용하여 그들을 정렬 싶습니다, 여기 내 명령입니다. 그래서 또 다른 4GB가 있습니다. INPUT_SORTED도 4GB입니다.
그리고 유닉스 정렬 파일을 정렬하는 임시 폴더를 사용하여 발견하고, 임시 파일도 4GB에 도달 할 수 있습니다.
성능을 유지하면서 디스크 사용량을 줄일 수있는 방법은 무엇입니까?
아마도 1000 개의 파일을 연결하지 말고 별도로 "정렬"해야합니다. http://stackoverflow.com/questions/3581215/in-unix-is-it-better-to-sort-multiple-small -files-or-one-big-file – Thilo