汉字的表示方法有哪些?

问题描述:

汉字的表示方法有哪些?

    1.汉字的输入编码    为了能直接使用西文标准键盘把汉字输入到计算机,就必须为汉字设计相应的输入编码方法.当前采用的方法主要有以下三类:    数字编码 常用的是国标区位码,用数字串代表一个汉字输入.区位码是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码.区码和位码各两位十进制数字,因此输入一个汉字需按键四次.
    数字编码输入的优点是无重码,且输入码与内部编码的转换比较方便,缺点是代码难以记忆.
    拼音码 拼音码是以汉字拼音为基础的输入方法.使用简单方便,但汉字同音字太多,输入重码率很高,同音字选择影响了输入速度.
    字形编码 字形编码是用汉字的形状来进行的编码.把汉字的笔划部件用字母或数字进行编码,按笔划的顺序依次输入,就能表示一个汉字.
    为了加快输入速度,在上述方法基础上,发展了词组输入\联想输入等多种快速输入方法.但是都利用了键盘进行“手动”输入.理想的输入方式是利用语音或图象识别技术“自动”将拼音或文本输入到计算机内,使计算机能认识汉字,听懂汉语,并将其自动转换为机内代码表示.目前这种理想已经成为现实.
2.汉字内码    汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示.英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”.为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”.
    注意:有些系统中字节的最高位用于奇偶校验位,这种情况下用三个字节表示汉字内码.
3.汉字字模码    字模码是用点阵表示的汉字字形代码,它是汉字的输出形式.
    根据汉字输出的要求不同,点阵的多少也不同.字模点阵的信息量很大,所占存储空间也很大.因此字模点阵只能用来构成汉字库,而不能用于机内存储.字库中存储了每个汉字的点阵代码.当显示输出或打印输出时才检索字库,输出字模点阵,得到字形.
图2.1 汉字的字模点阵及编码
  注意,汉字的输入编码、汉字内码、字模码是计算机中用于输入、内部处理、输出三种不同用途的编码,不要混为一谈.