谁说大模型都是冰冷的代码?其实,它也可以塑造“血肉之躯”。在8月15日讯飞星火认知大模型V2.0升级发布会上,我们见识了虚拟主播介绍世外桃源“桃花潭”的美景,也亲眼目睹了虚拟外教与刘聪院长“狂飙”口语的炫酷。而这些应用场景,都源于星火V2.0在多模态能力上的提升,让视频内容生产与英语学习效率大幅提升。

一站式图文、视频创作,讯飞星火V2.0多模态能力重磅升级

中金研报曾指出,如果虚拟角色在大模型等技术助力下,能够实现与用户实时智能互动,用户将获得更具真实感的体验,继而激活一个巨大体量的市场。何况,科大讯飞依托星火多模态技术,率先将其用于视频内容生产。根据中国电子信息产业发展研究院发布的数据,预计2023年中国超高清视频产业规模将达到4万亿。同时视频产业是一条涵盖生产、分发、消费等上下游的长链条产业,仅生产环节的市场规模就从2016年的19亿飙升至2022年的3860.7亿元,年均复合增长率达到222.34%。

基于视频生产环节巨大的商业机会,讯飞星火认知大模型以多模态技术实现“虚拟主播”出镜,不但极大提升了视频内容质感和新颖度,还能化身“景点导游”、”室内导览”以及“银行客服”等身份,在旅游、展览、金融等各行各业发挥巨大价值。据悉,科大讯飞虚拟人服务已在各行各业遍地开花,并与新华社、央视动画、中信银行、中国平安等公司建立了合作,在北京冬奥会、成都大学生运动会等世界性体育赛事,讯飞虚拟人技术都进行了精彩呈现。

一站式图文、视频创作,讯飞星火V2.0多模态能力重磅升级

为了极致简化使用难度,科大讯飞在星火V2.0发布会上,重磅升级了讯飞智作2.0一站式AIGC内容创作平台。用户只要录制一段真人出镜的3-10分钟视频,再将视频放到讯飞智作2.0平台进行训练,即可生成1:1还原的真人虚拟数字分身。同时也可以选择不同风格的配音,让虚拟人具有多情感演绎能力,结合内容本身的喜怒哀乐来控制语气、语调和停顿,让用户看到“有血有肉”的温情演绎。

2023年下半年,当同类大模型还停留在文本“二维”阶段时,讯飞星火认知大模型已进入音画“三维”阶段,实现了AIGC技术在内容生产与各行各业的“智慧涌现”。同时讯飞星火助手中心上线的一千多个智能助手,全方位满足了职场、营销、创作等各类场景需求,助力全方位提升工作效率,降低时间成本。而时间,就是这个时代最宝贵的东西!

如今,大模型正在悄无声息、却又影响深远地改变着人类世界。面向未来,正如讯飞董事长刘庆峰所期盼的那样:“今天讯飞星火2.0发布后,我们还会迎来3.0、4.0,希望到那时你已经成为了我们的伙伴,无论是API的开发伙伴、共建行业生态的伙伴、还是做最终应用的伙伴,相信都将成为在星火赋能之下工作和生活更幸福的伙伴。”