内蒙古出版集团蒙古文PDF编码转换技术获得第十届中国数字出版博览会2019-2020年度•创新技术荣誉称号

来源:本站原创时间:2021-01-04 09:53:38 编辑:苏利佈和

  2020年12月22日,第十届中国数字出版博览会2019-2020年度荣誉推介授牌仪式在北京举办。为了在行业内树立数字出版发展标杆,彰显数字出版先进单位、先进个人的带头作用,本届数博会继续开展“数字出版年度荣誉推介”活动。

  本次推介范围包含2019-2020年度在数字出版领域有突出表现的企业、人物、品牌、技术,包括“社会责任贡献单位”“创新技术”“优秀品牌”“优秀服务供应商”“影响力人物”“优秀展示”“优秀组织”七个项目。

  内蒙古出版集团有限责任公司基于DCR技术的蒙古文PDF编码转换技术获得2019-2020年度·创新技术荣誉称号。

  蒙古语言文字是在内蒙古自治区广泛使用的一种少数民族语言文字。从上世纪九十年代起,随着全国汉字计算机化处理技术的不断发展,蒙古文信息化处理技术也开始逐步应用。但是由于蒙古文信息处理方面的国家标准出台相对滞后,导致应用系统因为编码等问题与当前的国际标准编码互不兼容,同时也为后期资源的利用以及与国际标准接轨造成了困难。

  随着互联网技术的快速发展和应用,对内容资源的需求越来越迫切,如何利用好这些资源,既是当前蒙古文信息化建设和应用的困境,也是迫切需要解决的问题。

  内蒙古出版集团信息中心与内蒙古漠尼文化传媒有限责任公司强强联合,秉承推动数字出版、技术创新的宗旨,从编码转换入手解决上述问题。为了在实际应用中具有通用性和较强的适应性,选择PDF文件格式作为编码转换的中间格式。同时采用创新的DCR技术的PDF编码转换技术,既提高了转换的准确性,又尽可能地降低了人工校对的工作量,是海量资源编码转换的理想选择。

  在此项创新技术出现之前,蒙古文信息化建设和应用受制于呈现形态单一、内容无法检索、无法复制应用和无法应用到移动端等问题,信息化建设工作一直未能走出困境。但是随着DCR技术的应用,海量的蒙古文PDF可以快速、高效、准确地转为国际标准编码的PDF文件,为后期进行结构化加工和知识化加工铺平了道路。

  此项编码转换技术获得两项软件著作权登记证书,在蒙古文出版资源的数字化进程中起到了不可替代的作用。在完成内蒙古自治区民族事务委员会“蒙古语言文字数字资源建设与共享工程”项目资源加工过程中,应用此技术成果完成了7000多种图书资源的加工工作,为存量资源的数字化加工以及项目顺利实施提供了强有力的技术保障。

 

意见反馈

电子邮箱:nmgcbjtbgs@163.com

联系电话:(0471) 6661859

信箱地址:呼和浩特市新华东街89号出版大厦1楼大厅群众意见箱

监督举报

电话举报:(0471)6399197/3592290/6381282

邮箱举报:nmgcbjtjjjc@126.com 邮政编码:010000

来信来访地址:呼和浩特市新华东街89号出版大厦15楼 纪检监察室