过去半年,AI已经成功出圈,从“2023年第一个性感的主题”成为“影响未来的新一轮科技浪潮”;从科技圈的技术变化,成为全社会热烈讨论的话题。

海外国内科技巨头们纷纷发力大模型,创业者们也基于各种大模型探索原生应用,而影视游戏等领域也已经有公司感受到了生成式AI带来的降本增效,普通人也在讨论着会带来职场、教育等方面的影响。

大家都在等待着、期盼着。显然,浪潮也刚刚开始,未来的形态、格局,仍充满各种可能性、多样性;每家科技公司也都在探索、拓展新天地。正如在2023春季火山引擎FORCE原动力大会上,火山引擎总裁谭待则提出“(火山引擎)不做大模型,而是做AI大模型的发动机”。

AI大模型的发动机会是什么样呢?

两个多月后,6月28日,2023火山引擎V-Tech体验创新科技峰会召开,大家期待的“发动机”也重磅问世:“火山方舟”大模型服务平台。

新的思路、新的产品,会为行业带来怎样新的动能、新的变化?

多云多模型时代,要做什么?

战略的不同,决定了战术的安排。而对于AI时代未来形态的展望,也决定了每家公司入局的姿势。

比如关于大模型的玩家格局,有观点认为考虑到训练、推理成本比较高,持续研发投入比较大,因此,会出现寡头的少数玩家;但也有观点认为,大模型并不意味着唯大就好,考虑我国的产业纵深、各行各业的巨大差异性,原创大模型或二次开发的大模型,依然会是多样丰富。

而提到应用,AI原生应用,一定会爆发在各行各业。但开发也许并不是基于单独模型,而是基于多个模型多个版本,以及会有手机、汽车、电脑、家居等等多种载体。

基于多年业务经验和对技术的理解,火山引擎认为未来行业的发展会呈现“多云多模型”

这个判断,就会塑造企业的发展定位。在多云多模型的生态中,会发现存在着开发大模型之外,也非常需要、也值得去满足的需求。

比如对大模型开发者而言,算力够不够、成本高不高、如何更高效,这是创业必须解决的首要问题。其次,是市场,大模型开发出来后有哪些应用场景可以快速拓展,有哪些合作伙伴可以对接,这是决定发展的关键。而方舟的目标则是为大模型开发者提供服务平台,训练、推理一体化,让创新敢于发生,不至于夭折。

另一方面,应用开发者也有难题需要解决:如何选择合适的大模型、如何对大模型和自身应用的场景进行更好地匹配,如何确保数据的安全,如何在AI时代实现快速迭代等等。

对于此,火山方舟则清晰定位:连接大模型供需双方,匹配双方,同时也提供足够安全信任的方案,以及在训练、推理等环节需要的相关能力。

就像诺亚方舟并没有创造生命,但却在洪水中保全了生命一样;火山方舟并不开发大模型,但是用连接、服务的方式,促进大模型的发展、成长,形成模型、应用之间生态的繁荣、百花齐放。差异化的定位,给AI产业带来了新的“发动机”。

AI大模型的发动机,应该长什么样?

好的战术,是战略实现的路径。火山方舟的想法,如何落地呢?发动机该如何打造呢?拆解火山方舟的功能,会发现这是一个逐步推进的工程。

首要解决的是“信任”。火山方舟为应用客户提供专业的模型服务,保障客户信息安全;也重视模型提供者的知识产权,保护模型的核心资产,安全可信处理模型推理与训练代码。确保放心提供、放心使用。

有了信任之后,就是把人聚起来。火山方舟有一个功能是“模型广场”,模型供应方在模型广场进行模型创建、上传、部署等操作,而模型使用方也可以在模型广场查看模型并快捷体验。就像是一个管理有序的大集市,摆摊摆得有序,买家也可以货比三家。

人气有了,接下来就是促进大模型和应用双方更好的“匹配”。一方面,火山方舟提供了“导购”功能,可以精选多家优质大模型,满足丰富场景,降低用户的选择成本。另一方面,火山方舟也提供了模型训练、推理、评测、精调等方面功能,让模型和应用之间实现更好的磨合”。

比如,大模型和应用场景之间总有一些误差,需要调整。火山方舟提供了极简精调流程,客户选择基础模型、上传标注数据集后,就可以实现精调;对于有复杂需求的场景,客户也可以设置高级阐述、验证集、测试集等更丰富的功能,更自由地使用精调功能。

AI普及后,推理的需求会更加旺盛,便捷性也更加重要。对于此,火山方舟可以确保客户直接使用模型供应方已经部署的在线服务,或者便捷地将精调模型部署为在线服务。快速响应,更符合当下小步快跑、不断迭代的开发节奏。

东西好不好,不能看广告,而是看疗效。对于模型选择也是如此。虽然有了精调、快捷部署,但数据验证很重要,依然要根据数据来做出相应决策。因此,火山方舟推出了“模型评测”功能,打造了一系列评测工具,让大模型也跑个分,从而让客户系统化地感知模型表现情况,然后再决定后续的工作。

根据扎实、客观的数据来做决策,这就很有字节范儿。

当然,如果有敏锐感知,也不必等到有结果才做决定、“动大手术”。火山方舟提供了“运营干预”功能,让用户通过干预工具,可以快速设置相关规则,无需精调模型也可以干预模型输出结果。

以更通俗的视角来看,火山方舟就像是一位“月老”,从男女双方见面开始就各种操心、铺垫,交往后也一直跑前忙后、东看西顾,最终确保双方有着美满幸福的婚姻。而这男女双方就是模型提供方、应用开发方,美满的婚姻就是AI促进各行各业高效发展的繁荣生态。

要揽瓷器活,应该有怎样的金刚钻?

没有金刚钻,不揽瓷器活。没有亲和力,不要当月老。火山引擎凭什么可以打造火山方舟,为行业送来强劲的发动机?

提起字节跳动,很容易想到对算法的深刻理解,凭借算法打造了抖音、头条等等头部应用。而火山引擎作为字节跳动旗下的云服务平台,显然也对人工智能、模型、数据、应用等领域都有良好的理解。

而且火山引擎作为抖音的计算服务提供方,也已经经历了严苛的考验和充足的训练。比如在云弹性和性价比方面,火山引擎有三个优势比较突出:

资源复用。字节跳动国内业务拥有过亿核的CPU资源池、数十EB的企业存储,可以实现更极致的弹性和性价比,GPU算力方面,海量资源池,也是国内领先。可以为用户提供性价比的训练、推理资源。

全面云原生化,基于云原生实现了超大规模存储池化,帮助客户进一步用好云的弹性,提升资源利用率。同时,公司坚持全栈自研,可以为上层应用带来更高资源利用率。

比如自研体系中核心组件火山引擎DPU,性能也有显著提升,在大模型分布式并行训练场景的GPU实例相较上一代实例集群性能最高提升3倍以上;而新一代CPU实例,小规格实例性能最高提升6倍以上。发布的智能推荐-高速训练引擎,可以将模型的训练推理效率进行极致优化。

独乐不如众乐。火山引擎的机器学习平台是内外统一的,火山引擎客户和抖音用的是同样的平台。通过公司练兵,把最好的赋能给用户。火山引擎也可以将字节跳动快速发展过程中积累的增长方法、技术能力、应用工具等开放给客户。

提效的同时也在降本。火山引擎全新发布的SPOT实例,相比按量付费实例价格最高节省80%,能有效降低企业云服务器使用成本。

当然,产品再好,也要落地。火山引擎拥有完整的To B服务体系和团队,可以满足各个大型企业的应用搭建和交付服务需求。从而将认知、资源、能力等赋能客户,帮助客户构建用户体验创新、数据驱动决策、业务敏捷迭代等数字化能力。

比如,火山引擎与生物医药公司晶泰科技,一起针对算力等问题进行深度优化,共同应对AI药物研发中不同阶段不同环节的差异化需求。基于云原生的基座,共同打造了极速弹性、弹性伸缩、可以包容巨大算力的混合高性能计算平台。

AI创业公司MiniMax借助火山引擎机器学习平台研发了超大规模的大模型训练平台,实现了文本、视觉、声音三种通用大模型每天千卡以上的常态化稳定训练,在并行训练上实现了99.9%以上的可用性。在网络和存储上,双方合作优化将带宽利用率提升了10%以上。

DriveGPT雪湖·海若,是行业首个自动驾驶生成式大模型,它正是基于毫末智行与火山引擎联合打造的雪湖·绿洲(MANA OASIS)智算中心进行训练,浮点运算可达到每秒67亿亿次,存储带宽达到每秒2T,通信带宽达到每秒800G,在MANA OASIS强大算力支持下,DriveGPT将重塑汽车智能化技术路线。

集团的磨炼、能力的积累、客户的认可,这就是火山方舟在AI浪潮中“入海远行”的底气。

探索的意义

科技浪潮应该是什么样?事后可以总结,但每一轮的开始和过程,却没有办法预测。因此,每一种尝试、每一次探索都是有意义的。而确定性更高的,无疑是为产业生态的付出、添砖加瓦。期待火山方舟不仅成为AI大模型的发动机,也成为科技促进各行各业提效的发动机。