靠它读懂文字前世今生 陆上线「汉字全息字典」涵盖4种字符集

北京师范大学教授王立军介绍系统内容。(图/翻摄自央视网

大陆中心综合报导

汉字全息资源应用系统」日前正式上线,这是大陆国家语言文字工作委员会,基础资源建设项目「通用汉字全息数据库建设」的研究成果,由北京师范大学教授王立军主持。他说,透过该系统,「用户可搜索汉字字意字音,甚至历代辞书对该字的释义,及其在一些常用古籍文献中被使用的情况。」

▲汉字全息应用系统日前正式上线 。(图/翻摄自央视网)

「汉字全息资源应用系统」由北京师范大学中国文字整理规范研究中心、汉字研究与现代应用实验室负责实施。王立军说,这系统用意是在运用现代中文讯息处理技术建构一个具有多维关联关系科学系统、校园实用的「汉字全息数据库」,「从中小学基础教育领域到汉字研究的专业人士,系统可以满足不同人士的需要。」

综合陆媒报导,本期上线的系统涵盖4种字符集,其中常用字集3500字;通用规范字8105字;古籍印刷字16490字;全字符集81722字。另外还有辞书20种;古籍文献60种;历代字形图415675个。其中包括大量图形信息资源和文本信息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,涵盖了古今各个时期文字的形、音、义、用、码五大方面的重要信息。

此外,系统还能够显示「常用古籍文献中的句子」,选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,包括《尔雅》、《说文》、《康熙字典》、《新华字典》、《通用规范汉字字典》等,搜索时会显示历代辞书的释义。在每个字的「用例」一栏,系统也会自动选取具有代表性的传世文献作为古籍用例的来源,包括「十三经」、「二十五史」、「二十二子」等三大典籍系统,显示汉字在这些文献中的使用例句,供研究者参考使用。

▲汉字全息资源应用系统目前正在进行系统升级 。(图/翻摄自汉字全息应用系统网站