줄마다 한 단어로 된 큰 파일이 있습니다. 전체 파일이 정렬되고 압축해야합니다. GZIP을 사용하면 결과가 꽤 좋을 것입니다. 그러나 우리가 정렬 된 단어의 목록을 다루고 있다는 것을 더 잘 알게 될지 궁금합니다.정렬 된 단어 목록을 압축하는 방법은 무엇입니까?
[...]
ABAISSAT
ABAISSATES
ABAISSE
ABAISSEE
ABAISSEES
ABAISSEMENT
ABAISSEMENTS
ABAISSENT
ABAISSER
ABAISSERA
ABAISSERAI
ABAISSERAIENT
ABAISSERAIS
[...]
겠습니까 접두사 다음 GZIP을 더 나은 결과를 사용하여 파일을 압축 :
여기에 정렬 된 단어의 내 목록의 미리보기입니까?
[...]
ABAISS AT ATES E EE EES EMENT EMENTS ENT ER ERA ERAI ERAIENT ERAIS
[...]
내가 설명하는 종류의 압축을 사용하여 내 단어 목록을 압축 할 수있게 해주는 알고리즘은 무엇입니까? 내가 데이터를 압축 할 수있는 다른 생각?
P. 나는 Trie를 사용하는 것에 대해 생각하고 그것을 구현했습니다. Trie의 최종 크기는 목록 자체와 거의 같았고 목록을로드 할 시간은 매우 길었습니다. 이러한 이유로 나는 그 길을 가지 않기로 결정했다.
시도해 볼 수는 있지만 일반적으로 GZIP에서 얻을 수있는 것보다 좋지 않거나 약간 우수합니다. – nhahtdh
어떤 목적으로 파일을 압축 하시겠습니까? 단순히 디스크 공간을 절약하려고하십니까? 프로그래밍 방식으로 압축 된 구조를 조작하려고하십니까? 목표는 무엇입니까? – Shredderroy
Bzip과 7zip은 일반적으로 gzip보다 더 나은 압축률을 제공합니다. – Shredderroy