汉字区位码(国家标准信息交换汉字编码)

2023-03-31 16:04:31未知 作者:无限魅力物联网

汉字区位码是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。

中文名

汉字区位码

作用

为每个汉字编一个唯一的代码

优势

便计算机辨认、接收和处理

简介

在此介绍的是《国家标准信息交换汉字编码》。

这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。

国家标准

为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。

由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。所有的国标汉字与符号组成一个94×94的矩阵。

在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为01到94)、每个区内有94个位(位号分别为01到94)的汉字字符集。

一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号,在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字。

其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。

所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。

现在标准制订的大方向没有问题了,虽然在国际会议上,各方仍然为了各自的利益争论不休,但已经有了基本规则,ISO10646(GB13000/Unicode)已成为主流编码。[1]

点击展开全文
你关注的
seventeen为什么叫小次、小十七、婆队,他们是一线吗什么时候出道的?seventeen为什么叫小次、小十七、婆队,他们是一线吗什么时候出道的? 高叶今年年龄多大了,她和刘希媛长的很像对比照高叶今年年龄多大了,她和刘希媛长的很像对比照 金尤美整容前照片曝光,她多大了几几年出生的?金尤美整容前照片曝光,她多大了几几年出生的?
相关文章
上海猥琐男解女子内衣发泄 称地铁太挤无意骚扰上海猥琐男解女子内衣发泄 称地铁太挤无意骚扰 赏花发朋友圈的精美句子  赏花的心情句子唯美文案说说赏花发朋友圈的精美句子 赏花的心情句子唯美文案说说 抖音小窝怎么玩怎么进入  抖音小窝入口玩法介绍抖音小窝怎么玩怎么进入 抖音小窝入口玩法介绍 快手怎么开直播   快手直播权限开通条件方法教程快手怎么开直播 快手直播权限开通条件方法教程 安踏等多个品牌删除张继科宣传物料 终止与其合作安踏等多个品牌删除张继科宣传物料 终止与其合作 25年闺蜜谎称卖鸡蛋原是公司副董 事件反转:没撒谎!25年闺蜜谎称卖鸡蛋原是公司副董 事件反转:没撒谎!