人工智能出版业应用工具集

来源:国家知识服务平台时间:2024-04-19 16:10:33 编辑:本站编辑

今天,各行各业都在围绕新质生产力寻求创新发展的着力点,而AI大模型的实践探索无疑在这一过程中扮演着重要角色,其发展速度愈发迅猛,乃至部分资讯尚未掀起涟漪便已步入昨日黄花。2024年2月15日凌晨,Open AI发布了题为《Video generation models as world simulators》(《视频生成模型作为世界模拟器》)的技术报告,随报告一起推出了其文生视频大模型——Sora,我们相信或许Sora仅是OpenAI“世界模拟器”项目中的衍生品,但报告的第一幕就为我们呈现了一条时长为59s的AI生成视频(帧数:30fps,分辨率:1980×1080),这使我们比以往任何时刻都坚信我们将会触达AGI(通用人工智能)。

若非Sora生成视频所需的高昂算力成本将其限制在测试阶段,或许它的“作品”早已遍布我们的社交网络。Sora的问世,或者说OpenAI为我们展现的基于“世界模拟器”的项目计划,让我们相信AI在继大型语言模型中涌现出的逻辑推理和理解能力后,也将涌现出对物理世界理解与模拟能力(目前Sora对物理世界的模拟仍有着较强的局限,它难以模拟复杂的、拥有多种相互作用力的实体变化)。

当我们把视角回归到出版产业的应用,Sora或者说未来其他的混合型模型,将为我们带来一种突破现实世界创作条件限制的工具,它们会为创作者们打开通往虚拟创作的大门,拓展其作品的展现形式。例如,编辑或者作家们可以将纸书上的文字转化成生动的画面,而这一过程不再需要通过影视化表达,或者通过昂贵的动画表现;数字教材的制作也将更加丰富生动,我们可以将描述历史的文字与图片以视频、增强/虚拟视觉的方式重现在学生眼前,或者将复杂的科学概念以动画的形式进行演示,让教学过程更加直观与生动。从口口相传的语言到文字,再到图像与视频,信息载体不断发展,人类的叙述方式也在这个信息技术高速发展的时代悄然转变。但随着信息载体(从文字到图片到视频)为人类感官带来更丰富的体验,其创作成本、难度也整体呈现跨越式增长,而随着混合或融合型模型的发展,人类的想象力和创造力的边界将被不断拓展,这种拓展将表现于社交媒体当中,影响人类对历史的表达和人类对虚拟世界的构建。

“国家知识服务平台”梳理更新本期应用级工具,旨在为出版业追踪技术发展前沿与技术融合应用提供参考。目前,国内商业模型虽然在推理、数学、代码等方面距GPT-4 turbo还有一定差距,但在中文语言理解、中文知识和中文创作上,国内大模型相比GPT-4 Turbo有更强的竞争力。随着KIMI的异军突起,国内大语言模型纷纷开始支持200W字以上的长文档处理功能,并针对中文和中国本土应用进行场景优化,AI行业也将迎来更多突破性的应用。

声明:在应用“生成式人工智能”工具时请注意该工具的模型接口来源,保障数据安全,在使用中应遵循《生成式人工智能服务管理暂行办法》、《中华人民共和国数据安全法》、《中华人民共和国网络安全法》等法律法规的要求。如需上传数据,应注意防范本单位的核心数据泄漏。我们希望通过持续的追踪和梳理,能为出版业的智能化探索提供一些参考,但在试用包括以下工具在内的“生成式人工智能”工具时,请根据企业及应用场景的相关规定自行评估适用性。

注:收录范围仅包含免费工具或对用户提供免费测试入口的工具,且该工具以对外可访问的方式为用户提供服务。

意见反馈

电子邮箱:nmgcbjtbgs@163.com

联系电话:(0471) 6661859

信箱地址:呼和浩特市新华东街89号出版大厦1楼大厅群众意见箱

建言献策

电子邮箱:nmgcbjtdwxcb@163.com

联系电话:(0471) 6661859

信箱地址:呼和浩特市新华东街89号出版大厦1楼大厅群众意见箱

监督举报

电话举报:(0471)6399197/3592290/6381282

邮箱举报:nmgcbjtjjjc@126.com 邮政编码:010000

来信来访地址:呼和浩特市新华东街89号出版大厦15楼 纪检监察室