会议专题

汉语编码文字--输入码与内码一致的汉字编码

  我们现在所使用的汉字编码,输入码与内码是不一样的。输入码是用字符串表示汉字,而内码是用长度为两个字节或两个以上字节的二进制数表示汉字。内码不包含对应汉字的声、韵、调、义诸信息。人们无法根据内码的值去联系一个汉字,即内码无可读性。这一点与拼音文字在计算机上的应用很不相同。使用拼音文字的人们,他们没有什么输入码和内码,或者说,他们熟悉的文字就是输入码也是内码,根据内码就能理解文字所表达的含义。因此在文字的输入、输出、 存储、传输、排序、检索等文字信息处理各个方面都比我们方便。本文对汉语编码文字----输入码与内码一致的汉字编码问题进行了阐述。

计算机录入 文字处理 汉字编码 内码结构

范显镔

国内会议

中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会

苏州

中文

56-61

2011-10-19(万方平台首次上网日期,不代表论文的发表时间)