수십만 개의 개별 파일이있는 매우 크고 복잡한 디렉토리 구조의 두 가지 버전이 있는데 한 버전에서 다른 버전으로의 중요한 파일 변경 사항을 찾고 싶습니다.리눅스에서 프로그램 적으로 파일 크기 비교
각각의 모든 파일이 약간 변경되었습니다. (버전 - (버전 1)
[1065 마이크 18시 10분 수행 빌드가] - 예를 들어, 당신은
는 [마이크 12:00 일 1057 빌드] 포함됩니다라는 파일 intro.txt이있을 수 있습니다 2)
유용한 정보가 없으므로 변경 사항은 신경 쓰지 않습니다. 또한 맞춤법 오류에 대한 수정이나 한두 단어의 추가에 대해서는 신경 쓰지 않습니다.
내가 정말로하고 싶은 것은 어떤 파일이 더 중요한 방식으로 변경 되었습니까? 그들이 변경했을 수있는 한 가지 방법은 파일 크기를 늘릴 수있는 많은 추가 콘텐츠를 추가하는 것입니다. 관심있는 변경 사항입니다.
그래서 어떻게 파일을 찾는 디렉토리를 재귀 적으로 파싱할까요? 한 버전에서 다음 버전으로 설정된 금액만큼 증가 (또는 감소) 한 것입니다.
저는 리눅스를 사용하고 있지만 거의 모든 언어가 지원할 것입니다.
시작하기에 충분합니다. –
감사합니다. Doug - 시작하기에 충분 해 보입니다. 언어에 자유 범위를 부여했지만, 첫 번째 대답은 Python을 참조 할 것이라고 생각했습니다. :) – WalkingRandomly