导航:首页 > 方法技巧 > 如何提出编码方法

如何提出编码方法

发布时间：2023-02-15 02:35:42

‘壹’ 哈夫曼编码的原理是什么

霍夫曼（Huffman）编码属于码词长度可变的编码类，是霍夫曼在1952年提出的一种编码方法，即从下到上的编码方法。同其他码词长度可变的编码一样，可区别的不同码词的生成是基于不同符号出现的不同概率。

‘贰’ 哈夫曼编码的编码方法怎样

哈夫曼编码是一种编码方式，是可变字长编码(VLC)的一种。
以哈夫曼树—即最优二叉树，带权路径长度最小的二叉树，经常应用于数据压缩。在计算机信息处理中，“哈夫曼编码”是一种一致性编码法（又称"熵编码法"），用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符（例如某文件中的一个符号）进行编码。这张编码表的特殊之处在于，它是根据每一个源字符出现的估算概率而建立起来的（出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的）。这种方法是由David.A.Huffman发展起来的。例如，在英文中，e的出现概率很高，而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时，e极有可能用一个位(bit)来表示，而z则可能花去25个位（不是26）。用普通的表示方法时，每个英文字母均占用一个字节（byte），即8个位。二者相比，e使用了一般编码的1/8的长度，z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算，就可以大幅度提高无损压缩的比例。

‘叁’ 信息编码的基本方法有哪些

1、ASCII码

学过计算机的人都知道ASCII码，总共有128个，用一个字节的低7位表示，0~31是控制字符如换行回车删除等；32~126是打印字符，可以通过键盘输入并且能够显示出来。

2、ISO-8859-1

128个字符显然是不够用的，于是ISO组织在ASCII码基础上又制定了一些列标准用来扩展ASCII编码，它们是ISO-8859-1~ISO-8859-15，其中ISO-8859-1涵盖了大多数西欧语言字符，所有应用的最广泛。ISO-8859-1仍然是单字节编码，它总共能表示256个字符。

3、GB2312

它的全称是《信息交换用汉字编码字符集基本集》，它是双字节编码，总的编码范围是A1-F7，其中从A1-A9是符号区，总共包含682个符号，从B0-F7是汉字区，包含6763个汉字。

4、GBK

全称叫《汉字内码扩展规范》，是国家技术监督局为windows95所制定的新的汉字内码规范，它的出现是为了扩展GB2312，加入更多的汉字，它的编码范围是8140~FEFE（去掉XX7F）总共有23940个码位，它能表示21003个汉字，它的编码是和GB2312兼容的，也就是说用GB2312编码的汉字可以用GBK来解码，并且不会有乱码。

5、GB18030

全称是《信息交换用汉字编码字符集》，是我国的强制标准，它可能是单字节、双字节或者四字节编码，它的编码与GB2312编码兼容，这个虽然是国家标准，但是实际应用系统中使用的并不广泛。

6、UTF-16

说到UTF必须要提到Unicode（UniversalCode统一码），ISO试图想创建一个全新的超语言字典，世界上所有的语言都可以通过这本字典来相互翻译。可想而知这个字典是多么的复杂，关于Unicode的详细规范可以参考相应文档。Unicode是Java和XML的基础，下面详细介绍Unicode在计算机中的存储形式。

UTF-16具体定义了Unicode字符在计算机中存取方法。UTF-16用两个字节来表示Unicode转化格式，这个是定长的表示方法，不论什么字符都可以用两个字节表示，两个字节是16个bit，所以叫UTF-16。UTF-16表示字符非常方便，每两个字节表示一个字符，这个在字符串操作时就大大简化了操作，这也是Java以UTF-16作为内存的字符存储格式的一个很重要的原因。

‘肆’ 哈夫曼编码（Huffman编码）

Huffman编码又称霍夫曼编码，是一种编码方式，哈夫曼编码是可变[字长]编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据[字符]出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫做Huffman编码（有时也称为霍夫曼编码）。

假设4个字符出现频次不同，具体如下：

上面那个例子可以按照上面的算法逻辑进行编码，得到的总长度为
70×1+3×3+20×3+37×2=213Mbit

‘伍’ 请各位大虾提供以下具体的霍夫曼编码方法，要有具体说明和例题~~~

属于数字压缩编码技术：
霍夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫作Huffman编码。下面引证一个定理，该定理保证了按字符出现概率分配码长，可使平均码长最短。
� 定理：在变字长编码中，如果码字长度严格按照对应符号出现的概率大小逆序排列，则其平均码字长度为最小。
� 现在通过一个实例来说明上述定理的实现过程。设将信源符号按出现的概率大小顺序排列为： �
U： ( a1 a2 a3 a4 a5 a6 a7 )
0.20 0.19 0.18 0.17 0.15 0.10 0.01
� 给概率最小的两个符号a6与a7分别指定为“1”与“0”，然后将它们的概率相加再与原来的 a1~a5组合并重新排序成新的原为：
U′： ( a1 a2 a3 a4 a5 a6′ )
0.20 0.19 0.18 0.17 0.15 0.11
� 对a5与a′6分别指定“1”与“0”后，再作概率相加并重新按概率排序得
U〃：（0.26 0.20 0.19 0.18 0.17）…
� 直到最后得 U〃〃：（0.61 0.39）
� 分别给以“0”，“1”为止，如图4－4所示。}
� 霍夫曼编码的具体方法：先按出现的概率大小排队，把两个最小的概率相加，作为新的概率和剩余的概率重新排队，再把最小的两个概率相加，再重新排队，直到最后变成1。每次相加时都将“0”和“1”赋与相加的两个概率，读出时由该符号开始一直走到最后的“1”，将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好，就是该符号的霍夫曼编码。
� 例如a7从左至右，由U至U〃〃，其码字为0000；
� a6按践线将所遇到的“0”和“1”按最低位到最高位的顺序排好，其码字为0001…
� 用霍夫曼编码所得的平均比特率为：∑码长×出现概率
� 上例为：� 0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit
� 可以算出本例的信源熵为2.61bit，二者已经是很接近了。

‘陆’ 指令编码方式有哪几种

三种，直接表示法，编码表示法，混合表示法

直接表示法是将每个控制信号都作为微指令中的一个位。这种方法的特点是简单直观，其输出直接用于控制，但编码效率低。

2. 编码表示法是将微指令进行分组编码，将不同时出现的相斥信号分在一个组中，然后将其编码成较短的代码。这种方法减少了控制存储器所需要的存储器的代码的数量，但是编码的指令代码需要译码器译码，增加了控制信号的延迟，影响CPU的工作频率。

3. 混合表示法是把直接表示法与编码方法相结合使用，即采用部分直接表示部分编码的方法，将一些速度要求较高，或与其他控制信号都相容的控制信号以直接方式表示，而将剩余信号以编码方式。混合表示法便于综合考虑指令字长、灵活性和执行速度方面的要素。

阅读全文

与如何提出编码方法相关的资料

热点内容

金湖过滤器安装方法发布：2025-01-22 23:24:47 浏览：341

来的时的使用方法发布：2025-01-22 23:24:11 浏览：343

如何练习动力的方法发布：2025-01-22 23:20:55 浏览：214

养鸡啄毛解决方法发布：2025-01-22 23:20:51 浏览：41

内部审计研究方法发布：2025-01-22 23:05:06 浏览：134

销售眼镜技巧与方法发布：2025-01-22 22:58:20 浏览：609

黑枸杞正确食用方法发布：2025-01-22 22:58:08 浏览：462

如何分辨真假蜂蜜有几种方法发布：2025-01-22 22:50:37 浏览：836

魅族手机微信红包提醒怎么设置在哪里设置方法发布：2025-01-22 22:49:42 浏览：846

五十八乘一百九十八的简便方法发布：2025-01-22 22:49:31 浏览：980

话筒线与喇叭线连接方法发布：2025-01-22 22:44:35 浏览：119

土壤检测的方法发布：2025-01-22 22:42:49 浏览：341

教学方法教师教学工作基本环节发布：2025-01-22 22:37:48 浏览：300

秋繁如何分蜂方法发布：2025-01-22 22:29:50 浏览：380

蚕丝被的好真假鉴别方法发布：2025-01-22 22:25:47 浏览：358

仙客来烂根的治疗方法发布：2025-01-22 22:17:24 浏览：63

臀部松解最佳方法发布：2025-01-22 22:02:20 浏览：261

如何做辣椒油的最好方法发布：2025-01-22 22:01:27 浏览：498

课堂教学方法改革中的问题与对策发布：2025-01-22 21:47:19 浏览：39

白线癌的治疗方法发布：2025-01-22 21:20:07 浏览：641