词条 | 哈夫曼编码 |
释义 | § 概述 哈夫曼编码(Huffman Coding)是一种编码方式,是一种用于无损数据压缩的熵编码(entropy coding)算法.1952年,David A. Huffman在麻省理工攻读博士时所发明的,并发表于《一种构建极小多余编码的方法》(A Method for the Construction of Minimum-Redundancy Codes)一文。 哈夫曼编码的基本思想是对出现频率高的输入单元赋予较短的比特片,而对出现频率低的输入单元赋予较长的比特片,从而使编码后的字符串平均长度降低,达到无损数据压缩的目的. 这个思想与摩思编码类似. § 举例 例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。 |
随便看 |
百科全书收录594082条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。