2014-11-03 1 views
0

나는 몇 백만 개의 작은 텍스트 파일을 가지고있다. 나는 그것들을 더 빨리 처리하기 위해 각각 약 10 MByte의 더 큰 파일들에 그것들을 연결하고 싶다. 파이썬 스크립트로 시작하기 전에 쉘을 통해 그렇게 할 수있는 방법이 있는지 궁금합니다. 고양이 같은 파일의 최대 크기 매개 변수와 비슷합니까?소스 파일의 최대 크기로 파일을 연결하는 간단한 방법

답변

1

아마도 복수 파일에 cat을 시도하고 표준 출력을 파일로 푸시 할 수 있습니까? 이처럼 :

cat * > one_big_file

모든 하나 개의 큰 파일로 파일을하지만, 여러 개의 작은 사람을 처리하지 않으려면

- 일부 정규식에 의해 아마 그룹들은 파일 이름?

split -b10m one_big_file part 
:

cat `grep [regex]` > one_big_file 

는 또한 여러 부분으로 분할 한 후 하나 개의 큰 파일을 생성하려고 할 수 있습니다 (정확한 솔루션은 다음 파일 이름과 같이 방법에 따라 달라집니다)

관련 문제