发新帖  新投票  回帖  关闭侧栏
675个阅读者,0条回复 | 打印 | 订阅 | 收藏
隐身或者不在线

发表时间:2018-11-9 14:05

汉字检索编码现代化



库屠左夫 发表在 参考文摘 华声论坛 http://bbs.voc.com.cn/forum-49-1.html


摘自《中华文化宝库》第三册



  在科技时代,汉字检索编码机器化是专家们正在思考的
重要课题,这里介绍两种思路与方法。  
  其一,《新部首大字典》,这部1988年出版的辞书是由中
国学界泰斗、国际著名物理学家兼数学家王竹溪编纂的,250
余万字,兼收繁体字、简化字,在楷书单字条目下附录有代
表性的甲骨文、古文和小篆。令众辞书所望尘莫及的是该辞
典汉字部首划分继《说文解字》、《康熙字典》、《新华字典》三
次革新之后,又向前迈了一步,将以往数百部首改成56个新
部首,从而解决了汉字检索机器化的关键问题。王氏新部首
在充分照顾到汉字的读识习惯、具有极大的普及功能的同时,
充分考虑到汉字的结构特点,合理分割、拼接,基本上消除
了五万多汉字分解检索的重码现象,从而将以往汉字先检字
头后以页码查读音释义的两步检字变为如外文词典那样的一
步检字,为汉字自动化检索提供了优化方案。    
  其二,《中联全汉字编码输入系统》,1992年通过鉴定的
由肖启宏发明的“系统”可以实现“繁简古今一体炎黄子孙
群文化合流,中西文字兼容汉字文化圈资源共享”,对全汉字
信息处理的现代化具有重要意义,在处理全汉字领域的键入
技术方面处于国内领先水平。
  该系统拥有对全部汉字(包括外造汉字)的处理能力,是
应用中国文字学理论于中义信息处理科学的成功范例。它用
通用计算机及其输入输出设备,能方便、迅速地实现全汉字
的处理和输入输出,将我们祖先发明汉字的材料包括字元、部
件、笔画经过研究整理,限量固定在一张一目了然的图表之
内,应用古人创造汉字的原理和方法,将可见的定量模块转
换成与之匹配的字母和数字代码组,然后根据汉字字形和书
写习惯,有条不紊地组合出一个个不同汉字的代码。该系统
是经《汉语大字典》54620个汉字实施编码的检验下诞生的。
其字元和码源的选择符合汉字的分析原理和教学规律,规则
简单,无非常规编码,将文字学理论和信息处理技术结合一
体,贯通一律,易学易记;其处理简化字、繁体字、异体字、
古体字、讹体字和外造汉字的能力,是目前海内外唯一高效
实用的可对全部汉字编码输入的系统。
  这一系统的研制成功,为大型汉字库的应用、中文古籍
整理、图书编纂、情报检索、大型印刷厂的彻底变革创造了
条件,为海峡两岸的汉字交流、海外华人的汉字计算机处理
提供了方便。    




----------------------------------------------
炎黄子孙焉能不知自己的历史,让我们掀开朦胧的面纱,共同关注追寻历史的真面目.
发新帖 新投票
 回帖
查看积分策略说明快速回复主题
你的用户名: 密码:   免费注册(只要30秒)


使用个人签名

(请您文明上网理性发言!并遵守相关规定
   



Processed in 0.018532 s, 8 q - 无图精简版,sitemap,