苹果在全球开发者大会(WWDC)上公布其一系列人工智能更新的影响,苹果股价已连续三天上涨。截至6月13日美股收盘,苹果公司市值达到3.29万亿,成功超越微软再次成为全球最大市值公司。值得一提的是,在WWDC上苹果宣布与OpenAI达成合作,将在Siri当中提供ChatGPT接口,用户将可以通过Siri直接使用GPT-4o,而且免费、无需注册。
对于近期的基于大语言模型的新一代人工智能技术,我们采访了联想控股助理总裁、资产管理部董事总经理纪朝峰。他在过去10年间一直负责联想控股财务投资工作,目前管理约300亿元人民币的自有资产,而联想控股体系基金平台的管理规模已经超过了3,300亿元人民币,累计投资了超过200家人工智能相关的企业,形成了独有的科技生态。
纪朝峰认为,“Open AI推出的GPT-4o是大模型进行商业化的重要探索,预示着AGI应用距离第二阶段已经不远了。相比之前的模型只能读文看图和迟滞感明显的语音交互,如今GPT-4o可以实现实时多模态的自然交互。这意味着已经逐渐具备实时能看懂、能插嘴说、能思考响应,还能有各种小情绪自然交互的能力,未来随着模型进一步优化,人工智能真正成为智能。”
同时苹果股价大涨也印证了他之前的判断:未来AI将在以手机为代表的端侧硬件和碎片场景下的应用结合率先引爆,应用场景、用户基数等会被几何级放大,未来涉及的改变不只是几亿用户,而是几十亿用户。
这一波AI浪潮的进展将远超前几次的总和
其实从1956年人工智能概念被提出之后,AI技术的发展和应用已经过多次高潮和低谷。但不可否认的是,随着历次底层算法的改进,人工智能也开始从初期的非常简单的应用落地,逐步到更复杂、更多样化的场景应用,并且每次技术进步,相较于上一代应用取得的进展都是指数级别的。
具体来看,1956年达特茅斯会议后人工智能在数学领域特别是在机器定理证明方面取得了进展;第二波AI发展高潮里,人工智能在图像识别、语音识别和自然语言处理等领域均取得了突破。在从2015年到2020年第三波浪潮中,深度学习算法在人工智能应用方面取得了跨越性的突破,标志性事件是2015年DeepMind开发的AlphaGo击败了世界顶级围棋大师。此后深度学习技术在图像目标数据智能识别研究领域取得了突破性进展,引发了计算机视觉领域的革命性变革,并加速了在自动驾驶、工业场景落地。
纪朝峰看来,“上一代AI专注于解决特定领域的问题,性能和准确性依赖于特定场景训练数据的数量和质量,缺乏推理和创造性思维能力,更多还是基于规则和数据驱动进行决策。在处理复杂问题、创新和灵活性要求较高的任务时会表现出局限性。更适合在特定场景下的小模型,一旦切换场景,需要进行重新优化,导致上一代人工智能很难实现泛化,无法形成具有结构性优势的解决方案,使得商业化进入瓶颈期。”
与前三次AI浪潮不同,本轮的基础大模型是建立在Transformer架构上,其独特的注意力机制模拟了人类的感知方式和注意力行为,使得模型能够专注于输入数据中的关键部分,解决了上一波深度学习模型中长距离信息依赖关系的问题。随着对Transformer架构大模型对自然语言处理的巨大进步,并逐步迁移到计算机视觉、音频处理等其他领域,为不同领域提供了可共用的平台,使得以往分散的模型走向统一。这一变化不但简化模型设计的复杂性,同时提高了模型的通用性和可拓展性。
具体表现上来看,从文生文、文生图到文生视频,这些都是初期的简单应用。随着行业垂直模型的成熟和具身机器人技术的进步,大模型不断解锁新能力,解决上一代AI尚未攻克的复杂场景,大面积取代体力劳动,并逐步提高智力劳动的效率。一个人加上具有很强泛化能力的AGI助手,就可以完成过去需要多人协作的复杂任务,这可能会成为未来世界的常态。纪朝峰判断,这波AI浪潮带来应用上的进展将远超前三次浪潮的总和。生产力的快速提升会显著改变生产关系,很多行业的商业模式将会受到冲击,但同时也孕育着巨大的商业机会。
大模型融资速度仍落后于商业落地
从2023年初,大模型展现出强大的多轮对话和文生图能力后,让大家产生对AI时代的惊鸿一瞥,从此成为创投圈最炙手可热的风口。
从融资上来看,近一年多时间OpenAI估值已近千亿美元,国内做基座大模型的6家头部公司估值也超过100亿人民币。如果按照他们产生的收入来看,都是100倍以上PS,甚至还有几家压根没有收入。从这个角度来看,当前各家大模型公司的估值确实高得出奇。
纪朝峰分析,“高估值反映出投资人认可AI大模型技术仍在快速发展和迭代中,具有巨大的发展潜力和变革能力。市场对这些公司的估值是基于对其长期增长潜力的乐观预期。”但值得注意的是,国内还有二三十家做通用底座大模型的公司却没有得到资本这样的认可,他们有的根本融不到钱,有的也就几亿元人民币的估值,这也反映出高估值只是给到技术实力领先的头部大模型公司。
从应用落地上看,过去一年多的时间里,大模型应用率先落地的行业中并没有给用户带来太多惊艳的提升。纪朝峰认为:“当前无论是在C端商业模式尚不明朗,还是B端缺乏令人眼前一亮的应用,主要还是因为当前AGI的应用仍处于第一阶段,即当前的应用还是把大模型在多轮对话、超长文本理解、文生图、文生视频等方面的突破与原有业务进行单点结合,只是边际性提升效率,并未创造出新的场景。我预期AGI发展很快会进入第二阶段,会带动AI技术对接多业务环节产生应用,甚至出现高度融合,AI在某些业务环节中推动业务发展的阶段,可以按照人类的目标性要求独立完成工作,替代人类完成高复杂度的任务,这些场景都是上一代人工智能技术尚未解决的深水区。随之而来的企业成本结构的巨大改变,将彻底改变很多行业的游戏规则。目前,在我们看到的一些项目里,已经出现了用大模型去替换非标准化人工服务的商业模式,比如保险、法律诉讼、诊疗等场景。”
任何快速发展的行业都存在泡沫风险,AI领域也不例外,关键要看后续AI大模型的技术迭代和商业化落地是否能够支持其高估值。如果市场对AI大模型公司的预期过于乐观,而实际商业化的进展无法支撑高估值,那么泡沫会很快破灭。
对此纪朝峰十分乐观,“从OpenAI、Google和Meta等公司大模型的技术发展,以及国内公司紧跟的态势来看,AI大模型技术仍在不断创新,给行业带来新的机会。从商业化落地的速度和产生的经济效益来看,的确慢于大模型技术的发展和估值的提升,但这样的情况将随着大模型技术持续迭代,多模态大模型和各个垂直场景大模型的发展得到解决,领先企业的高估值将会得到支撑。”