文|《中国企业家》记者 姚赟

编辑|李薇

头图来源|中企图库

李彦宏对ChatGPT和AIGC,是“真爱”。又一次在公开场合中,他集中多次用“兴奋”来表达了自己的情绪。

北京时间2月22日,百度发布了2022年Q4和全年财报。当晚的财报电话会上,李彦宏表示:“我们显然对ChatGPT和AIGC(利用人工智能技术来生成内容)感到兴奋,它代表了一个巨大的趋势,可以改变很多事情。”

进入2023年后,ChatGPT一路火爆,除了带火了ChatGPT产品本身、延伸出的AIGC、相关概念股外,ChatGPT背后的大模型技术也正式走上台前。

李彦宏在财报电话会上还表示:“我们正在研发文心一言,这是一种新版本的生成式AI产品,搭载了我们最新的语言大模型技术(LLM)。我们将首先在百度搜索中嵌入文心一言,并将于3月向公众开放。”

2020年,李彦宏的新书《智能经济》发布,同年5月,他接受采访时透露了百度在研发方面的投入,“这些年(百度研发投入占比)基本上都在15%左右。有时候稍微高一点儿。对百度这样规模的公司,15%其实很高了。”最近几个季度,核心研发费用占百度核心收入比例都超过了20%。

这样的投入无疑会让财报数据变得“不那么好看”,但李彦宏还是坚持了对未来的判断。他当时表示:“百度本身的定位就是一家高科技公司,我们应该保持这个投入。而且,确实很多投入是需要有耐心的,它不是两三年就能有回报的。但是如果你信这个东西,你就可以七年、十年坚持投下去。”

李彦宏确实应该感到兴奋,他对AI的热情,在用真金白银持续燃烧了六七年后,已经能够看得见临界点了。


来源:中企图库

先来看这次百度数据和今年值得关注的突破性规划。

本次财报数据显示:2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增长10%。2022年第四季度,百度实现营收330.77亿元,归属百度的净利润(非美国通用会计准则)53.71亿元,同比增长32%。

整个财报发布中,这些数据似乎并不是主角——AI和即将在3月份推出新一代的大语言模型“文心一言”才是主角。

财报电话会中,百度明确将“我们如何乘上AI的浪潮”作为2023年的第二大主题。而这个主题的关键,是基于过去AI的累积,将技术累积与业务进行融合。如:

还有B端业务的整合,如:

整个财报电话会中,凡涉及到AI的问题,李彦宏都一一进行了详细解答。其中,在关于人工智能商业化的机会方面,李彦宏给出了三个方面的规划。

为什么ChatGPT一经问世,大家都感受到了突破性的变化?ChatGPT到底与过去的智能问答机器人有什么区别?

在产品形态上,ChatGPT或许与过去的智能问答机器人看起来相似,但背后的支撑技术其实已经有了大变革。

2月20日,复旦大学的MOSS悄然上线,邱锡鹏团队发布至公开平台,邀公众参与内测。但是由于瞬时访问火爆,计算资源无法支撑,内测窗口已暂时关闭。这件事引发了大家对另一个词的关注——大模型技术。

复旦大学计算机科学技术学院教授张奇是推出MOSS的复旦大学NLP实验室核心成员之一。他在接受媒体采访时表示,AI的差距可能并不来源于中美,中国在自然语言或人工智能的研究上面,应该是没有大的差距,“但是对于ChatGPT这样一种模式来说,它其实是企业和高校之间的差距。

张奇解释,在之前的一些人工智能的研究,不需要花太多成本,“但如果一旦到了大模型,那实验室没有一个500万元的设备,可能就做不了。”他还提到,如果想做到更大,就得有几千万元的设备,“比如说我们现在分析ChatGPT,它中间有非常多的过程和细节,我们都不知道,只能靠去猜,那如果你想复现,几个亿先拿出来。”

为什么大模型这么重要?

IDC发布的《2022中国大模型发展白皮书》中指出:随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成本。


来源:IDC

从这幅《训练大模型“预训练+精调”模式》示意图能看到,支撑能力和应用的原料是数据。而现阶段,大部分用来训练的数据需要经过标注,也就是人工操作让机器学习。这无疑在效率上是和需求不匹配的。而在大模型中,海量无标注数据是通过自监督学习后,再进入精调。

《2022中国大模型发展白皮书》还提到:随着数字经济、元宇宙等概念的逐渐兴起,人工智能进入大规模落地应用的关键时期,但其开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题开始显露,阻碍了规模化落地。

在此背景下,再来看李彦宏为什么那么兴奋。

他在财报电话会中透露:

ChatGPT引发的AI大风口,恰好直接撞在了李彦宏怀里。

李彦宏早已确定AI便是百度的未来。2017年世界智能大会上,李彦宏表示,人工智能的思考方式和互联网时代已经完全不同。现阶段,智能手机已经完全普及,手机还会长期存在,但留给移动互联网的机会不多了。开发者的思维方式需要从“think mobile”到“think AI”、从关注软件到关注芯片等硬件的转变。

而那时候,还是移动互联网的黄金时代。

认清自己,等待临界点

ChatGPT的应用,背后是AI发展累积多年等来的“奇异点”。ChatGPT作为一款可以与人类用自然语言进行交流的人工智能,“与人类用自然语言”才是关键。


来源:视觉中国

“今天,人人都在谈论人工智能的颠覆性影响。生成式AI和大模型的智能涌现,是全新的计算范式带来的新机会。”在财报电话会召开前,李彦宏发布了内部信,“AI技术已经发展到一个临界点,各行各业都不可避免地被改变。中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。而百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。”

显然,李彦宏捕捉到了这一“质变”,也找到了更契合百度“焕新”的契机。

2022年12月末,李彦宏在面向全体员工的一场内部直播中表示,AIGC和ChatGPT这些都是AI技术发展到一定地步后产生的新机会,“技术能做到这一步了,但是它会变成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。这个事情很难,但百度必须要做。”

让李彦宏作出这个判断的原因是,这可能“引领搜索体验的代际变革”。

2020年5月,李彦宏曾公开表达过他对搜索引擎未来发展的判断,那时他就认为AI是关键。在他看来,搜索本质上就是在解决人工智能最终需要解决的那个问题,就是机器要真正地理解人的意图,并且能够做出相应的回应。“搜索引擎从第一天起做的就是这个事。”

当时,李彦宏还详细解释了搜索技术的发展:第一代的搜索完全是用词频统计;第二代是超链分析,就是用别人的引用来证实内容的全面度和相关性;2010年前后,搜索技术完全转向了AI技术,就是用机器学习的方式:哪些用户搜哪些词,点了哪个结果,他在那个结果上停留多长时间等。

但那时来看,这种理解还是方向性的。

2021年4月,百度二次上市,彭博社采访了李彦宏,当时李彦宏对搜索引擎未来的发展与理解,与11个月前相比更明确了,他表示:“未来,自然语言理解会成为主角,当机器可以真正理解人们在说什么的时候,一大批应用就会应运而生,而且会比现在的应用更加流行。”

二次上市时,百度募集了30多亿美元,在被问及该资金如何使用时,李彦宏斩钉截铁地回答:肯定会投资于新技术、研发以及打造更多的创新产品。

对百度或者李彦宏来说,坚持投入并不是一件容易的事。

“确实有很大的压力,毕竟周围很多人天天盯着股票价格,会告诉你别人又做了什么特别火的产品。但是我们更愿意把这个时间轴稍微拉长一点来看技术的价值。看三五年的东西,你会面临很多诱惑,但是你看一个30年、50年甚至更长时间的东西,你会发现坚持自己的理想还是很有价值的,最终也会有回报。”李彦宏曾表示。

对李彦宏来说,静水深流的日子,百度已足够熟悉,持续蓄力AI,静待蜕变重生,才是一个比旧日荣光更激荡人心的商业故事。