导航:首页 > 知识科普 > 汉字编码方法有哪些

汉字编码方法有哪些

发布时间:2022-06-10 22:48:13

1. 汉字输入编码可分几类各有何特点

汉字输入编码可分5类,特点如下:

1、整字输入法:

前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上。大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法”。

比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入。键盘上或字表中字按部首或按音序或按字义联想而排列。不常用的字作为盘外字或表外字,另行编码处理。

2、字形分解法:

将汉字的形体分解成笔画或部件,按一定顺序输进机器。笔画一般分成 8种:横一、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉十、方(口)。

部件一般归纳出一二百个。由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上。

3、字形为主、字音为辅的编码法:

这种编码法与字形分解法的不同在于还要利用某些字音信息。如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。

4、全拼音输入法:

绝大多数是以现行的汉语拼音方案为基础进行设计。关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ──机内软件变换(实为查机器词表)──汉字输出”系统。

5、拼音为主、字形为辅的编码法:

一般在拼音码前面或后面再添加一些字形码。拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”。

如F键既表声母F,又表韵母ang,连击两下,便是Fang“方”字。区分同音字的字形码也多种多样。除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。

(1)汉字编码方法有哪些扩展阅读:

汉字编码研究的趋势:

1、混合式编码法。笔触字表示法中除整体字之外,增加一些部件或字符,可以解决盘外字问题,甚至能具有字形分解法的全部优点。而笔画方案为了提高速度,一般也增加一些部件或整字。

2、充分利用简码和词汇码。这样可以提高输入速度。因而人们为少量出现频率高的字或词设计了单字母和双字母的简码。

词汇码也是提高速度的手段。有一种形码方案的词汇码是根据每个字的部件规定的,如“汉字编码”的词汇码是43、45、55、13(氵冖纟石)。另一种形码方案的词汇码是利用计算机引导方式输入的。

例如,当“中”字输入后,一按语词键,屏幕上便显示出“中国”、“中型”、“中性”、“中华”等双音词;选择“中国”后,如再按一下语词键,便可显示出“(中国)话”、“(中国)人民”、“(中国)共产党、”、“(中国)工农红军”等词或词组。

音码方案的词汇码实际上为词组码,如 ZRG“中华人民共和国”,ZZXY“中国中文信息研究会”。词汇码不仅能提高速度,而且也能区别同码。但是,如果用得太多,也会产生重码。因此,有必要划分通用词汇码和专业词汇码,以减少重码。

3、充分发挥“电脑”的作用,尽量减少“人脑”的负担。上述计算机引导输入法就是一例。还有的方案不断以开窗口方式向操作员提供选择的范围。这样,操作员不必再记忆大量的编码规则。

2. 汉字的三大编码

三大编码???
不止三种把??
汉字的编码体系主要有以下几种:
⑴ 国标、区位、“准国标”
国标是将七千余个汉字以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行称为一个“区”,每个区有94个“位”。一个汉字在方阵中的坐标,称为该字的区位码。为了与美标(ASCII)的形象码的范围重合,出现了“国标码”,即将区位码的两个十进制数都加上32,得到该汉字的国标码。
当需要区分国标码和美标码时,出现了“准国标”,即将国标码的两个数字各加上128,而把原来的国标码称为“纯国标”。
⑵ GBK
GBK码是GB码的扩展字符编码,对多达两万多的简繁汉字进行了编码。
⑶ BIG5码
BIG5码是针对繁体汉字的汉字编码。
⑷ HZ码
HZ码是在Internet上广泛使用的一种汉字编码,它是以“纯国标”的中文与美标码混用为方案。
⑸ ISO 2022 CJK码
这是国际标准组织为各种语言字符制定的编码标准。CJK是中、日、韩语的合称。它主要在Internet中使用。
⑹ UCS和ISO 10646
UCS是由ISO 10646定义的,是其他字符集标准的一个超集,保证与其他字符集是双向兼容的,它包含了所有已知语言的字符。
⑺ Unicode
Unicode提供一种统一的字符标识方法,它是16位编码的,具备世界各地计算机与出版行业所用字符的全部代码。而且它的产生是以各个国家或国标字符编码为基础的。目前,Unicode在网络、Windows系统和很多大型软件中得到应用。

建议你去图书馆找些书查查,书本会介绍得很清楚的,嘿嘿.

3. 汉字涉及到几种编码

汉字在计算机上的编码主要有三种:输入码、机,内码和输出码,1.用于输入的汉字的编码——输入码(外码)
计算机上输入汉字的方法很多,如键盘编码输入、语音输入、手写输入、扫描输入等,其中键盘编码输入是最容易实现和最常用的一种汉字输入方法。英文等可以用键盘上的每个字母键来输入,而输入汉字则不同,不可能用有限的按键来对应每一个汉字,为了让用户能直接使用英文键盘输入汉字,于是就有了输入汉字时使用的汉字输入码,它一般由键盘上的字母或数字组成,代表某个汉字或某些汉字、词组或句子。当前用于汉字输入的编码方案很多,如区位码、拼音码、王码(五笔字型)、自然码等。
2.用于储存汉字的编码——机内码(内码)
由于汉字输入码的编码方案多种多样,同一个汉字如果采用的编码方案不一样,其输入码就有可能不一样。如果计算机内部存放的是汉字输入码本身,就会造成相同汉字在机内可以用不同的编码表示,这样显然不合理,也给计算机内部的汉字处理增加了难度。为了将汉字的各种输入码在计算机内部统一起来,就引进了汉字的机内码。
3.用于输出汉字的编码——输出码(字型码)
存储在计算机内的汉字在屏幕上显示或在打印机上打印出来时,必须以汉字字形输出,才能被人们所接受和理解。汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。汉字是一种象形文字,每个汉字东可以看成一个特定的图形,这种图形可以用点阵、向量等方式表示,而最基本的是用点阵表示。所谓点阵方式,就是将汉字分解成由若干个“点”??组成的点阵字型,将此点阵字型至于网状方格上,每个方各试点阵中的一个“点”。

4. 汉字常用的编码有哪几种呢

由此可见,汉字的输入编码、汉字内码、字模码是计算机中用于输入、内部处理、输出三种不同用途的编码 这是我的回答,希望对你有帮助。

5. 汉字的编码有几种各有什么用途

汉字的编码分为外码、交换码、机内码、字形码和地址码。具体用途如下:

1、外码(输入码)

外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。

2、交换码(国标码)

计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。

3、机内码

根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。

4、汉字的字形码

字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。

5、汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。它与汉字内码有着简单的对应关系,以简化内码到地址码的转换。

(5)汉字编码方法有哪些扩展阅读

1、机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。

2、通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。

3、通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。

6. 汉字编码有哪些

汉字的编码体系主要有以下几种:
⑴ 国标、区位、“准国标”
国标是将七千余个汉字以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行称为一个“区”,每个区有94个“位”。一个汉字在方阵中的坐标,称为该字的区位码。为了与美标(ASCII)的形象码的范围重合,出现了“国标码”,即将区位码的两个十进制数都加上32,得到该汉字的国标码。
当需要区分国标码和美标码时,出现了“准国标”,即将国标码的两个数字各加上128,而把原来的国标码称为“纯国标”。
⑵ GBK
GBK码是GB码的扩展字符编码,对多达两万多的简繁汉字进行了编码。
⑶ BIG5码
BIG5码是针对繁体汉字的汉字编码。
⑷ HZ码
HZ码是在Internet上广泛使用的一种汉字编码,它是以“纯国标”的中文与美标码混用为方案。
⑸ ISO 2022 CJK码
这是国际标准组织为各种语言字符制定的编码标准。CJK是中、日、韩语的合称。它主要在Internet中使用。
⑹ UCS和ISO 10646
UCS是由ISO 10646定义的,是其他字符集标准的一个超集,保证与其他字符集是双向兼容的,它包含了所有已知语言的字符。
⑺ Unicode
Unicode提供一种统一的字符标识方法,它是16位编码的,具备世界各地计算机与出版行业所用字符的全部代码。而且它的产生是以各个国家或国标字符编码为基础的。目前,Unicode在网络、Windows系统和很多大型软件中得到应用。

建议你去图书馆找些书查查,书本会介绍得很清楚的,嘿嘿.

7. 汉字编码有哪些类型,各有什么特点

汉字编码有五种类型,分别是整字输入法、字形分解法、字形为主字音为辅的编码法、拼音为主字形为辅的编码法、全拼音输入法。具体特点如下:

1、整字输入法

将三四千个常用汉字排列在一个具有三四百个键位的大键盘上;一字一格(键),无重码,直观性好,操作简单;但需特制键盘,速度较慢。

2、字形分解法

汉字的形体分解成笔画或部件,按一定顺序输进机器;按形取码,不涉及字音,因而不认识的字也同样可以编码输入;汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一。

3、字形为主、字音为辅的编码法

要利用某些字音信息,如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码;有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。

4、全拼音输入法

以现行的汉语拼音方案为基础进行设计;操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理。

5、拼音为主、字形为辅的编码法

在拼音码前面或后面再添加一些字形码,拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”;除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。

(7)汉字编码方法有哪些扩展阅读:

定型标准

1、定型化

编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要。当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要。

2、标准化

1981年,国家标准局公布了《信息交换用汉字编码字符集基本集》(简称汉字标准交换码),共分两级,一级3755个字,二级3008个字,共6763个字。这种汉字标准交换码可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性。

8. 什么是汉字编码

每天,我们都窝在格子间里噼里啪啦敲代码敲到脱发,对代码我们是再熟悉不过的老朋友了。


但不知道小伙伴们有没有想过这样一个问题:


那些让我们“英年早秃”的代码,到底是怎么来的呢?


今天,丽斯老师就带大家看看,这个让我们爱恨两难的“老朋友”究竟是何方神圣。


什么是编码?


编码,是信息从一种形式或格式转换为另一种形式的过程,简单来讲就是语言的翻译过程。


我们都知道计算机使用的是机器语言即二进制码,相信大部分人都无法流畅的阅读二进制码。


于是为了能够让人类更好的理解计算机输出的结果就需要将机器语言转换为自然语言。


比如英语、俄语和中文等。


这看似简单的语言转换过程,随着计算机的普及,与互联网化对语言字符的编码冲击也越来越大。


编码规范的调整也伴随着整个计算机发展历史在逐步完善,甚至“愈演愈烈”。


UTF-8又是什么


Unicode确实是一套能够满足全球使用的字符集,但是难道真的需要每一个字符都占用4个字节吗?


虽然现在的存储空间已经足够大了,但是4个字节一个字符的方式还是很不明智的。


比如字符“A”二进制码01000001却需要以的方式存储。


这一定不是我们想要的。


于是UTF(Unicode/UCS Transformation Format)应运而生。


UTF是字符编码五层次模型的第三层,通过特定的规则对Unicode字符编码进行一定的压缩和转换以便快捷传输。



UTF的代表就是UTF-16和UTF-8。


千万不要以为UTF-16比UTF-8更厉害能够容纳更多字符。


字符容纳数量都是是Unicode编码集所确定的范围,UTF只是通过不同的转换形式更快更高效的找到特定字符。


而UFT-16 比较奇葩,它使用 2 个或者 4 个字节来存储。


对于 Unicode 编号范围在 0 ~ FFFF 之间的字符,UTF-16 使用两个字节存储,并且直接存储 Unicode 编号,不用进行编码转换,这跟 UTF-32 非常类似。


对于 Unicode 编号范围在 10000~10FFFF 之间的字符。


UTF-16 使用四个字节存储,具体来说就是:


将字符编号的所有比特位分成两部分。


较高的一些比特位用一个值介于 D800~DBFF 之间的双字节存储。


较低的一些比特位(剩下的比特位)用一个值介于 DC00~DFFF 之间的双字节存储。


设计UTF-8编码表达方式的理由:

1、单字节字符的最高有效比特永远是0(大家可以看看其他编码方式如何别扭的兼容ASCII码的);


2、多字节序列中的首个字符组的几个最高有效比特决定了序列的长度。最高有效位为110的是2字节序列,而1110的是三字节序列,如此类推;


3、多字节序列中其余的字节中的首两个最高有效比特为10。


转换关系如下图:



这样我们根据所要兼容的语言不同根据UTF-8多字节最高有效比特,去判断编码最终使用了多少个字节来存储。


其余的字节也都满足最高有效比特为10的特点有了一定的纠错功能。


简单一些理解就是UTF-16就是通过2个字节16位来控制压缩比例。


而UTF-8已经以高精度的1个字节8位来控制压缩比例了。


当然还有中UTF-32就可想而知,基本跟Unicode如出一辙。

9. 汉字输入编码有4种方式,哪一种的编码方式是固定的

数字编码方式是固定的。

汉字编码方案的一种,可归结为下列几种类型:

1、汉字拼音编码。以汉语拼音为基础的汉字输入编码,在汉语拼音键盘或经过处理的西文键盘上,根据汉字读音直接键入拼音。

2、汉字字形编码。所有的汉字都由横、竖、撇、点、折、弯有限的几种笔划构成,并且又可分为‘左右’、‘上下’、‘包围’、‘单体’有限的几种构架,每种笔划都赋予一个编码并规定选取字形构架的顺序。

不同的汉字因为组成的笔划和字形构架不同,就能获得一组不同的编码来表达一个特定的汉字,广泛使用的‘五笔字形’就属于这一种。

3、汉字直接数字编码。利用一串数字表示一个汉字,电报码就属于这种。

4、整字编码。设置汉字整字大键盘,每个汉字占一个键,类似中文打印机,操作人员选取汉字,机器根据所选汉字在盘面上的位置将其对应编码送入计算机。



(9)汉字编码方法有哪些扩展阅读

大多数数字编码采用位置表示法,即任何一个数字量都可以通过一些数字的和来表示。根据这些数字码在表示式中所处的不同位置,有不同的值。也就是说,每个不同的位置,都具有自己的“权"。

十进制数据系统为人们最熟悉的数字系统,但是在数据转换和计算机处理中,使用十进制数据系统是很困难的,甚至是不现实的,这需要使用十个不同的电路状态分别表示十个数字符号。然而,可以采取许多方法使电路表示出两种不同的状态,于是,二进制数据系统得到了广泛的应用。

对数字数据的数字编码是指将二进制0/1数字数据变换成具有一定极性、幅度、比特速率,跳变规则的方波波形(数字信号)。

10. 汉字编码按编码方法不同,可分为哪四大类

汉字编码主要分为四大类:汉字输入码、汉字交换码、汉字内码和汉字字形码。
(1)汉字的外部码
汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。
(2)汉字的内部码
汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。
(3)汉字交换码
在计算机之间交换信息时,要求传送的汉字代码符合国家规定的交换码标准,即符合GB2312-80信息交换用汉字编码集,又称为国标码。国标码收集了7445个图形字符,其中有6763个汉字和各种符号709个。
国标码规定,每个汉字用两个字节表示,每个字节仅用低7位,最高位为0。汉字的国标码和内码有—一对应关系,即将高位加l,国标码就变为内码。
(4)汉字字形码
在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的点阵。尽管汉字字形有多种变化,笔画繁简不一,但都是方块字且大小相同,都可以写在同样的方块中。把一个方块看成m行n列矩阵,共有m×n个点,称为汉字点阵。如16×16点阵的汉字,共有256个点
汉字点阵和字形的对应关系是,有笔画处的点为1,无笔画处的点为0。这样,汉字的点阵可以对应若干字节长的字形码。这种表示汉字点阵的方法称为汉字字形的数字化表示法。

阅读全文

与汉字编码方法有哪些相关的资料

热点内容
乌药种植方法 浏览:175
平常如何侧方入库最笨方法 浏览:488
踝骨软化锻炼方法 浏览:421
如何活到极致的方法 浏览:599
平面图钢筋计算方法 浏览:674
用什么方法给小孩做棉裤 浏览:597
鲢鱼怎么做才好吃简单的方法火锅 浏览:638
和田籽料二上色的鉴别方法 浏览:715
圣荷纳米霜使用方法 浏览:168
货车多利卡打不着火解决方法 浏览:395
韩束紧致水分面膜使用方法 浏览:113
摩托车前叉连接方法 浏览:428
交流和直接的电流计算方法 浏览:465
龟田锻炼身体的方法 浏览:767
曾仕强怎么使自己开悟的方法 浏览:253
大拇指甲沟炎治疗方法 浏览:911
高中数学解题方法技巧汇总 浏览:330
u盘扩展内存方法手机 浏览:37
除螨包的最佳方法 浏览:24
瓷砖鱼池漏水最简单的补漏方法 浏览:17