3

기하 급수적으로 분산 된 데이터를 압축하는 데 도움이되는 예측 모델 인 기계 학습 알고리즘이 있습니까? 이미 golomb 코드를 사용하여 파일을 인코딩 했으므로 엄청난 공간을 절약 할 수 있지만 충분하지 않습니다. 압축이 필요합니다. PAQ8L은 충분히 압축하지 않습니다.데이터 압축 - 지수 분포를위한 기계 학습

필요한 경우 파일을 요청하십시오. 급격하게 분산

-

{A, B, B, A, A, B, C, C, A, A, B, A, A, B, A, C, B, A, B , d}

+0

루스리스? .... –

+0

허프만 코딩의 변형은 아마도? – biziclop

+0

"PAQ8L은 압축하지 않습니다." 당신의 기대는 무엇입니까? 데이터의 크기는 얼마이고 압축 비율은 "충분"합니까? 귀하의 기대치가 너무 높아서 도달 할 수 없을 수도 있습니다. 어쩌면 당신은 (당신은 많은 기억이 필요합니다) cmix 시도 할 수 : http://www.byronknoll.com/cmix.html. – flanglet

답변

1

이론적으로는 불가능하다고 생각합니다. Golomb code은 이미 기하학적으로 분산 된 데이터에 가장 적합합니다.

+0

사실이 아닙니다. google paq8l; 그것은 적어도 50 % 흥미로 웠던 golomb 코딩 된 문자열을 압축합니다. 네, 확실히 가능합니다. –

+0

예, 저는 무손실 압축이 필요합니다. –

+0

다른 게시물에서 언급했듯이 PAQ * 알고리즘은 컨텍스트 혼합 알고리즘을 사용합니다. 이는 단순히 "기하 급수적으로 분산 된"것보다 데이터에 대해 더 많이 알고 있음을 의미합니다. @ user562688 –

0

다른 게시물에서 언급했듯이 PAQ * 알고리즘은 컨텍스트 혼합 알고리즘을 사용합니다. 이는 단순히 "기하 급수적으로 분산 된"것보다 데이터에 대해 더 많이 알고 있음을 의미합니다. 지수 분포 만 데이터에 대해 알려진다면 Golomb 코드가 여전히 최적이라고 생각합니다.

관련 문제