三千生僻字将入字库 各领域系统升级可识生僻字

近日,《法制晚报》记者从北大方正电子有限公司(以下简称“方正电子”)获悉,该公司将承担“中华字库”中第17包“当代人名地名用字搜集与整理”工作,将收集人口信息中约3000个未编码的生僻字。该项目预计在明年10月完成,可有效解决用生僻字取名无法录入
dede58.com 三千 生僻 字库 领域 系统 升级 可识

  近日,《法制晚报》记者从北大方正电子有限公司(以下简称“方正电子”)获悉,该公司将承担“中华字库”中第17包“当代人名地名用字搜集与整理”工作,将收集人口信息中约3000个未编码的生僻字。该项目预计在明年10月完成,可有效解决用生僻字取名无法录入、显示的问题。

  困扰名字为乱码 难领社保卡

  市民刚女士的名字中,带有一个“䶮”(yan,三声)字。多年来,她办理火车票、飞机票都无法正确显示全名,“电脑打出来的是问号、方块,或者干脆是乱码。”因为电脑“不识字”,工作两年的她至今未能申领到社保卡,只能自费看病。

  由于无法在支付宝上完成实名认证,刚女士用不了滴滴、快滴等打车软件,就连抢到的红包都提不了现金。记者在商务印书馆出版的第10版《新华字典》中,查到了这个“䶮”字。词条解释为人名用字,是五代时期南汉的刘䶮为自己造的字。

  刚女士说,父母为她起名时用这个“䶮”字,是取“飞龙在天”的寓意,“他们真没想到会给我带来这么多麻烦”。

  解决3000生僻字 明年完成编码

  生僻字取名带来的问题有望得到解决,记者近日从方正电子获悉,该公司将承担“中华字库”中第17包“当代人名地名用字搜集与整理”和第20包“字库制作一:中间字库、宋体楷体等成果字库”项目,预计在2016年10月完成。

  方正电子字库业务部副总经理黄学钧介绍,“中华字库”工程于2011年启动,共分为28个包,近30家高校、科研院所和企业参与了研发工作。方正电子负责的第17包,将收集人口信息中约3000个未编码的生僻字,将“中华字库”中的汉字总量扩充到7万余个。

  第20包将制作完成包含30万字的宋体、楷体成果字库以及7万多字的压缩字库,可满足我国各民族古今各类文献的出版印刷、数字化处理和传输的需要。

  刚女士名字中的“䶮”字,在家用电脑上可以打出,但在社保和银行的系统中无法显示。黄学钧解释说,只要是电脑里能打出的字,都是被编码过的,“也就是已经收入字库了”。

  他分析认为,可能一些单位的数据库没有升级,还是用的老字库,所以显示不了“䶮”字,“只要升级系统、更新字库就没问题了”。他提到,“中华字库”中的每个字都有对应的编码,“相当于门牌号”,如“䶮”字的编码为“4DAE”。

  黄学钧表示,生僻字的搜集范围应在公安、民政、教育、邮政、测绘、银行等领域中选取,但必须包含公安和民政部门。“我们完成项目后,也会积极向银行、社保、医疗、教育等领域推广,帮助单位、企业升级字库系统,解决生僻字带来的烦恼。”

  文/记者 马晓晴

(原标题:三千生僻字将入中华字库 方正电子承担“当代人名地名用字搜集与整理”工作 明年10月将完成 各领域系统升级可识生僻字)

向作者提问

  • 最新评论

游客
验证码: 点击我更换图片
全部评论
^