RLE 编码

2024年1月29日 594次阅读来源: 游程编码问题

RLE全称（run-length encoding），翻译为游程编码，又译行程长度编码，又称变动长度编码法（run coding），在控制论中对于二值图像而言是一种编码方法，对连续的黑、白像素数(游程)以不同的码字进行编码。游程编码是一种简单的非破坏性资料压缩法，其好处是加压缩和解压缩都非常快。其方法是计算连续出现的资料长度压缩之。

一种压缩过的位图文件格式，RLE压缩方案是一种极其成熟的压缩方案，特点是无损失压缩，既节省了磁盘空间又不损失任何图像数据。

在打开这种压缩文件时，要花费更多时间，此外，一些兼容性不太好的应用程序可能会打不开。

RLE压缩方式　算法

ABBBBBBBBA – 1A8B1A

不过RLE还有一个缺点，那要是内容像ABCABCABC的话使用这种算法文件会增大，就是1A1B1C1A1B1C1A1B1C了，更长，就达不到压缩的效果了。简单的说RLE压缩就是将一串连续的相同数据转化为特定的格式达到压缩的目的。

下面都对byte流压缩。

如输入数据

LPBTEpByte={1,1,1,1,1,1};

压缩的数据为6,1

压缩了4个字符。

但是在数据流里面不能直接这么替换，而应该使用特殊的控制字符，否则无法解压。

比如pByte={6,1,0,1,1,1,1,1,1};

这样有两个6,1无法判断是原有的6,1还是{1,1,1,1,1,1}压缩后的代码。

所以应该有控制字符。

(1)

为了达到最大压缩率，可以先扫描源数据流，使用最少出现的字符做控制字符。

如pByte={6,1,0,1,1,1,1,1,1,…};

扫描后发现0为最少出现的字符。

我们使用0作为压缩的控制，其他字符代表他本身。源数据里面的0,用0,0来表示。

那么pByte压缩后为

6,1,0,0,0,6,1……

解压时BYTEa,b,c;

a=依次扫描压缩数据，如果输入字符为非控制字符，则直接输出到解压流。

如果为控制字符，b=其下一字符是否也为控制字符，如果是，在输出流输出控制字符的代码。

如果不是c=读压缩流，然后输出b个c到输出流。

注意:该处对于>Ctrlcode的编码需要自己计算偏移.

如ctrl=2.那么n=3时应该修正为2.

刚才介绍的方法是最大压缩率的，但是因为对每个输入字符需要检查，速度不算快。

(2)

为了增加解压速度，可以采用其他的编码方式。

主要方法是不对每个输入字符进行检查，只检查较少次就达到几乎相同的压缩率。

来看看这个改进的方法。

仔细观察，其实对不重复的字符也可以用控制n+数据的方式表示。这里的n带表n个未压缩数据。

还是刚才的数据。

pByte={6,1,0,1,1,1,1,1,1}

不用扫描选择0为控制

压缩为3,{6,1,0,}0,6,1

nctrlnm

解压就非常方便了

扫描数据读一个字符，

{

n=read;

if(n)

{

字符拷贝n个

}

else

{

n=read();

m=read;

write(n个m);

}

(3)优化

对(1)的优化。

观察得知，1,1,1这样的数据压缩率为0。

    原文作者：游程编码问题
    原文地址: https://blog.csdn.net/evsqiezi/article/details/22297583
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。