AI续文脉芸帙焕新颜!三部门发文部署“数字中文”建设
来源:华体会平台 发布时间:2025-04-28 04:07:39
3月31日,记者从教育部发布会上获悉,近日该部协同国家语委等三部门共同印发了《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》)。根据《意见》,我国将实施数字中文服务教育发展行动,助力打造中国版人工智能教育大模型;到2027年,要基本建成国家语言文字大数据中心。
人工智能技术加快速度进行发展,中国如何加强数字中文建设,从而推动中文信息处理技术创新发展?
发布会上,教育部语言文字信息管理司司长刘培俊介绍,《意见》明白准确地提出,将数字中文建设作为服务数字中国建设的重要任务和全方面推进语言文字信息化发展的突出重点,全方位释放语言文字在经济社会持续健康发展中的数据要素价值。在实践中,既要规范、有效、批量地将中文资源信息转化为智能数据,也要促进中文数据的规模生产、优质集成、规范治理和复用增效,实现以数字化手段构建新型中文服务体系,引领带动语言文字信息化全面发展。
为何强调数字中文?刘培俊表示,中文使命重大,数字中国建设,加大国家通用语言文字推广力度、深化中华优秀语言文化传承、增进语言文明国际交流互鉴等多项重大任务都更加需要中文数字化赋能。
中文文化内涵丰富,是中国贡献给世界的重要公共文化产品,更加需要中文数字化传播。中文应用限制范围广泛,更加需要中文数字化学习。而且,中文数据价值突出,大规模、高质量的中文数据有利于推动中国特色大语言模型创新发展,更加需要中文数字化支撑。
刘培俊表示,在数据资源建设上,发挥语言文字服务国家语言能力建设的战略作用,实施国家关键语料库建设规划,建设大规模中文语料库等。在关键领域赋能上,发挥信息技术赋能国家语言服务体系构建的全局优势,研制大语言模型能力素养框架(师生版),推进甲骨文数字化共享,实施中华文化优秀课程多语种数字化传播计划等。
北京大学王选计算机研究所所长汤帜表示,要加强数字中文建设,推动中文信息处理技术发展进入新阶段。“新形势下,语言文字将实现从‘静态符号’向‘动态数字资产’,从‘信息载体’向‘生产要素’的转型,要重点支持文本生成与理解、语言翻译、情感分析等各种任务。”
汤帜同时指出,语言文字还要从基础支撑提高到赋能全局发展,要实现语言文字与信息技术的深层次地融合,就要形成“技术突破—场景落地—生态繁荣”的良性循环。
事实上,在数字中国建设落地推进过程中,近年来已涌现出多种创新赋能的中文信息处理技术应用实践和生态场景。
昨天刚刚闭幕的2025中关村论坛上,南都记者在科技探馆中就身临其境地体验了一场宋代织布作坊的劳作场景。通过裸眼3D建模和AI交互技术,参展企业中科数字将《本草纲目》《天工开物》等古籍转化为生动的数字资源。以《天工开物》中《乃服篇》的数字还原场景为例,南都记者无需佩戴任何VR/AR类辅助设备,仅通过pad操作,裸眼3D打造的宋代纺织机模型旋即跃然眼前,纺纱女工们娴熟的手艺流程逐一呈现,环绕立体的作坊人声真切可感,令记者沉浸式体验了一把北宋年间天工开物的古代智慧。
“我们这项技术以专业史实为制作标准,完成了织布花机的三维立体还原,还原了1800根经线的纺织。”中关村论坛展台现场,中科数字商务总监封旭阳向南都记者介绍,目前该项技术已覆盖了包括首都图书馆在内多家文化公共机构的数字基建体系,“我们大家都希望能以AI技术赋能古籍数字化、具象化,为非遗传承提供新路径,助力珍贵的古籍赓续文脉、重获新生。”
南都记者观察到,当前以AI交互为代表的数字技术,正让中文古籍在文物价值外呈现慢慢的变多古文本身的学术、文化价值。以封旭阳提到的首都图书馆珍藏的古籍为例。记者获悉,今年初,首图古籍数字资源发布平台就已正式上线,读者能够最终靠数据库,从“版本”“版式”“装帧”等了解古籍,在“珍品赏析”中看到同一个汉字在不同古籍中的书写风格。在“古今对读”中,在线实时将古籍转换成简体字、横版阅读,自动给文章断句。
其中特别惊艳的一个版块是古籍专题库中的“微剧场”,由首都图书馆联合阿里巴巴通义实验室,利用通义万相视觉生成大模型,以明万历刻朱氏玉海堂印本《牡丹亭》第十出“惊梦”为蓝本,通过AIGC技术生成“游园惊梦”的短片,为首图读者提供最接近原本的梦幻视觉呈现。首都图书馆也是近日文化和旅游部公布的第二批国家级古籍修复中心之一。
31日的发布会上,北京师范大学党委常委、副校长康震就提到,为积极应对以大语言模型为代表的人工智能技术对教育变革带来的新机遇、新挑战,北京师范大学将发挥古籍整理智能化关键技术优势,针对古汉语信息处理任务“低资源”“富知识”的特点,以解决领域知识学习需求为核心任务,使用1.8B(18亿)参数量,训练出理解力强、准确率高、应用场景丰富的“AI太炎”古汉语大语言模型。
刘培俊亦表示,未来在技术创新应用上,要发挥自然语言处理技术支撑AI发展的基础作用,加快领域大语言模型应用试点,确保规范安全,示范应用;研制面向人工智能的语言资源建设、管理、应用标准,特别是语料和数据质量评价标准等。
据四川省纪委监委4月27日消息,邻水县委书记黄永鸿被查。邻水县政府网站显示,上周黄永鸿还多次主持会议并讲线月,黄永鸿任邻水县县长,2020年12月任邻水县委书记,至此番任上被查。上周黄永鸿多次以县委书记身份主持会议并讲话。
浙江宁波慈溪是我国三大家电生产基地之一,其中出口美国的占比约16%。慈溪一家家电企业负责人和记者说,他们跟美国客户签署协议时,对方支付了30%的定金;而同规格洗衣机、冰箱的零部件通用性很强,能达到70%。因此,即便美国客户违约,他们也可将产品重新翻包后再次销售。
#票房 消失术?上海一影院偷瞒《#哪吒2 》票房逾25万 #上海dou知道
超高清超耐磨的一款水晶老花镜,宋老师果然没推荐错 #老花眼镜#送老人的实用礼物#超便宜超划算#送礼佳品
外面世界已发展成这样了?网友坐高铁发现车窗是触摸屏,不仅能看视频 还能控制车窗进光模式,小桌板还可以无线万次播放
有些机关事业单位干部职员在考了职称后,挂靠职称证书给公司,比如会计证、统计证、建造师、电气工程师、消防工程师、土木工程师等等。
许多人都在找各种方法来控制和改善自己的血压水平。在这样的一个过程中,一些看似普通的食材,如黄瓜,因其独特的营养价值和健康益处,逐渐受到大家的关注。
4月24日《人民日报》刊文《最高法发布典型案例,回应社会关注热点 未成年人在校受伤,学校一定担责吗?》,通过对相关案件中各方责任的认定,推动学校教育、管理职责落实到位,引导监护人提高责任意识。
赖清德下手了,台名嘴蔡正元戴电子脚铐不能出境,朱立伦更是被约谈恐遭逮捕!台湾省现在是越来越乱了!自从赖清德上来了以后,采取了各种高压政策打击对手,愚弄老百姓,弄的人心惶惶!