위키 백과, 슬프게도 ... 어떤 형태의 XML (?) 문서도 텍스트로 유지합니다.
wikipedia database schema을 살펴보십시오. 특히 최근 변경 사항 및 텍스트
따라서 "생물학"페이지의 첫 번째 사본에 멋진 O (1) 조회가 있습니다. 이것은 wikipedia의 technology cost을 2010-2011 년 8 백만 달러 달러에서 2011-2012 년 12 백만 달러로 급상승하게하는 불행한 부작용이 있습니다. 이것은 HDDs (및 그 외 모든 것)가 더 비싸지 않고, 더 비싸지는 않을지라도입니다.
모든 파일을 유지 보수하는 개정판입니다. 힘내는 귀여운 접근 방식을 취한다. Is the git storage model wasteful?을 참조하십시오.
위의 방법과 유사하게 모든 파일을 저장합니다. repo가 차지하는 공간이 일정한 제한을 초과하면 무차별 재 포장을합니다 (얼마나 힘들게 설정 할지를 선택할 수 있습니다 --window = [N], - 깊이 = [N]).델타와 무손실 압축을 조합하여 재 포장 (recursively delta) 한 다음 비트가있는 부분에 무손실을 적용합니다.
SVN과 같은 다른 프로그램은 간단한 델타 압축을 사용합니다. (당신이 신뢰하면 안되는 기억에서).
각주 : 델타 압축은 증분 변경 사항을 저장합니다. 무손실 압축은 zip, rar 등과 거의 같습니다.