2010-06-15 5 views

답변

1

태그 기반 데이터는 간단한 알고리즘을 사용하여 상당히 쉽게 압축 할 수 있습니다.

모든 고유 태그 또는 속성 이름에 대해 ID를 할당하고 ID, 상점 ID 및 태그 이름으로 태그를 별도의 파일로 대체 한 다음 압축하여 우편 번호로 압축합니다.

그런 다음 zip에서 압축을 풀어서 태그 ID를 별도의 파일에있는 태그 이름으로 바꾸십시오.

(당신은 두 개의 파일을 사용할 필요가 없습니다, 당신이 동일한 파일에 할 수있는)

또한 태그 나 속성의 개별 '단어'내부에이 방법을 수행 할 수 있습니다.

이것은 압축하는 것보다 시간이 좀 더 오래 걸리지 만 반복되는 텍스트가 많은 중간에서 큰 파일의 경우 전송할 데이터의 양을 절약 할 수 있습니다.

'http post data'에 정의 된 내용을 알지 못하고 다만 태그 만 있으면 비슷한 알고리즘이 작동 할 수 있습니다.

+0

GZip 또는 Zip 압축보다 더 좋은 결과를 얻지 못할 가능성이 많습니다. –

+0

@ Software Monkey이 방법은 많은 양의 반복 된 데이터에 적합합니다. 이 작업 후에도 GZip 또는 Zip으로 데이터를 처리 할 수 ​​있습니다. Excel의 XSLX 파일은이 방법을 사용하여 파일을 zip 이상의 단계로 압축합니다. – Meiscooldude

+0

요점은 이것이 본질적으로 zip 유형 알고리즘이하는 것이며, 가장 잘 수행 할 가능성이 높습니다. 왜 그렇게 괴롭습니까? –

0

HTTP에 대한 두 개의 표준 압축 Content-Encoding 값은 gzip 및 deflate입니다.

IE 8에서 Java 서버의 deflate를 사용하여 문제가 발생하여 gzip으로 전환되었습니다. 나는 더 이상 조사 할 시간이 없었지만, (a) Java DeflaterOutputStream의 간단한 출력 이상이 필요했거나, 몇 가지 추가 래핑과 같이 (b) 필요했던 옵션이 있다는 인상을 받았다. 정확한 상호 운용성을 보장하기 위해 설정되어야합니다.

필자의 경험에 따르면 gzip은 텍스트 내용을 매우 잘 압축하므로 IE, FF 및 Chrome에 대해 몇 년 동안 아무런 문제없이 Content-Type: gzip 및 으로 작업 해 왔습니다.

관련 문제