12月10日,中国科技产业智库「甲子光年」在北京中关村国家自主创新示范区展示交易中心举办「万千流变 一如既往——2024甲子引力年终盛典」。甲子光年智库院长宋涛重磅发布主题报告《万千流变,一如既往:2024人工智能产业30条判断》。以下为报告详细内容。
1.历史回望:七十载沉浮,AI终临战略拐点
1.1 从甲子光年的愿景说起:探索科技与人类文明的关系
甲子光年从2017年底成立至今,每一年都会举办科技产业盛典,我们一路走来,在七年的时间里见证了中国科技产业从2017-2018年的“少数人的路”,到2019年科技全球竞争下的“纵身一跃,科技突围”,再到2020年的“命运与共,大道不孤”。
在这个时间段中,中国科技产业,尤其是在数字技术能力方面,还处于“看得到新技术”和“看得懂新技术”的阶段。
2021年,我们看到大量中国科技公司开始“行至水深处”,数字时代全面开启,用得上新技术成为千行百业走向数字化转型的重要目标。
2022年,中国科技公司已经进入到“心有所护,不畏远行”的阶段,从“用得上新技术”向“用得好新技术”转型。这一年的年底,ChatGPT的发布,引爆了新一轮人工智能革命的浪潮。
2023年,我们看到科技公司开始迈入到从数字原生向数智原生转型的阶段,我们看到形形色色的科技从业者们,以星星之火汇聚在新一轮人工智能浪潮之下,看到了微观重塑宏观的“致追风赶月的你”。
甲子光年过去七年的科技主题,见证了中国数字时代的发展脉络,从看得到新技术,到看得懂,再到用得上、用得好新技术的阶段。如今我们已经迈入构建中国式新技术范式的新征程。
回望甲子光年成立的初衷和这七年走过的路,我们可以看到一条围绕技术能力提升与生长之路。
过去,我们更多聚焦在技术能力之上,但如今已经到了探索中国式技术范式的时刻,需要寻找技术能力赋能应用的新范式。
1.2 诺贝尔奖的颁发,意味着AI成为全球角逐的核心领域
2024年的诺贝尔物理学奖授予给了美国科学家约翰·霍普菲尔德和加拿大科学家杰弗里·辛顿,表彰他们“通过人工神经网络实现机器学习的基础性发现和发明”。
AI技术获得诺贝尔物理学奖,标志着AI技术作为一股不可忽视的力量,正在推动科学研究的范式转变,成为解决长期存在的复杂科学问题的重要工具。
AI技术开始全方位影响人类科学技术的进步,并通过推动科技进步加速,进一步推动社会、经济的发展。
诺贝尔奖的颁发,意味着AI成为全球科技角逐的核心领域。如同甲子光年过去七周年的发展历程一样,开始向着聚焦数智原生的方向转变,已经到了构建中国式人工智能技术发展与应用新范式的阶段。
1.3 回望:反映到人工智能领域,其发展历程会拉长到70年的周期
既然如今竞争的核心收敛到了人工智能领域,那我们有必要重新梳理一下人工智能的发展历程。
人工智能概念自1956年被提出,其发展到现在已经接近70年,70年的发展历程已经历了四个阶段:
第一个阶段的AI是以逻辑推理为主,AI能力以聚焦决策和认知为主;
第二个阶段的AI则是以概率统计的建模、学习和计算为主,AI能力开始聚焦感知、认知和决策;
第三个阶段的AI聚焦学习环节,注重大模型的建设,AI能力覆盖学习和执行;
第四个阶段则聚焦执行与社会协作环节,开始注重人机交互协作,注重人类对人工智能的反馈训练,当下正处于此阶段。
经过近七十年的发展,人工智能的核心能力一直在提升,到如今已经成为覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合人类情感、伦理与道德观念的智能机器迈进。
发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。
1.4 历程:生成式AI加速人工智能产业向规模应用演进
生成式AI技术浪潮的开启,进一步加速推动人工智能产业从技术能力向规模应用演进转变。
在七十年的发展历程中,前六十年都是围绕着决策式AI技术发展。最近十年周期里生成式AI技术开始快速发展,尤其是从Transformer技术提出之后,整个人工智能的技术发展方向开始从决策式AI向生成式AI倾斜。ChatGPT的爆火出圈,引起了生成式AI的技术革命浪潮。
2023年里,大家讨论比较多的还是技术能力,但从2024年开始业内探讨核心从技术能力转向了需求应用。
1.5 拐点:人工智能的发展已到战略拐点
结合甲子光年发展历程所梳理的技术能力水平,以及技术发展周期性的特点,甲子光年智库将技术能力的发展水平分成了五个阶段。
第一阶段酝酿期:属于前期的技术研发阶段。看得到新技术,注重技术能力的孵化与提高;
第二阶段构造范式:属于看得懂新技术。新产品、新产业的爆炸性增长和迅速创新,除了注重技术能力的提高之外,还需要注重产品能力的提高;
第三阶段成长期:属于用得上新技术新产品。新产业、新技术体系接连出现并持续更新,技术能力和商业变现同样重要;
第四阶段产业化:属于用得好新技术。创新和市场潜力的全面扩张,新技术带来产业范式的颠覆式创新;
第五阶段成熟期:属于中国式新技术。新产品和新产业接近成熟,已经构建独立的技术体系。
随着技术能力的提升,技术进化引发经济进化,从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。
能力驱动 or 需求驱动?这是当下每一家人工智能企业都需要回答的课题。
关注公众号「甲子光年」,后台回复“2024甲子引力年终盛典”,获得报告高清版完整PDF。或者点击文末“阅读原文”,进入甲子光年官网下载。
2.现状洞察:能力驱动or需求驱动,AI企业的战略抉择
2.1 【大厂】OpenAI,正处于从能力驱动向需求驱动转变的拐点
OpenAI从成立开始,一直在坚持技术信仰路线,以技术能力的提升作为公司发展的核心驱动力。在2023年之前,OpenAI一直坚持的是底层大模型的能力研发,不断完善自然语言大模型、多模态大模型的通用能力。
但这一战略在2024年开始出现了拐点,尝试向需求转变,推出了GPT-store,构建以OpenAI为生态主的AI生态体系,开始探索如何向商业化目标转型。
或许,也正是这一战略抉择的转变,导致了OpenAI在2024年的管理层巨变。可以说,2024年是OpenAI从能力驱动向需求驱动转变的拐点之年。
2.1 【大厂】英伟达,连续三次推动从能力向需求的战略转型
接下来,我们来看一下这轮人工智能浪潮之中的另一个弄潮儿,英伟达。
甲子光年智库梳理了英伟达过去六年的收入结构分布数据,以及这六年里英伟达的核心客户和主要售卖产品分布情况。
从英伟达的收入结构变化可以清晰地看出,英伟达在过去六年的时间里连续三次根据客户的需求情况进行了业务调整。
第一次,从2019年到2020年,英伟达的核心客户开始从以PC端为主的游戏市场,向着个人PC和数据中心并重的游戏与区块链市场转型。最具代表性的是核心客户从戴尔、惠普变为了亚马逊、Vmware。这一阶段,PC端的收入贡献开始出现下降趋势。
第二次,从2021年到2022年上半年,英伟达的核心客户开始从区块链市场向元宇宙市场转变。其收入结构之中,数据中心的收入占比已经超过了40%,个人PC端收入的占比开始大幅度下降。核心客户从亚马逊、Vmware变为了亚马逊、Meta、微软等。
第三次,从2022年下半年到如今的2024年。英伟达的核心客户从元宇宙全面转向了人工智能领域,服务对象也从数据中心全面转向到了智算中心。其收入结构之中,数据中心从2022年占比39.4%提高到了2024年的78%,实现了核心产品结构的重塑。核心客户也全面转向了微软、亚马逊、Meta等AI大厂为主。
三次能力向需求的拐点时机,英伟达都把握住了。我想,这正是英伟达能登顶全球市值最高企业的根本原因。其发展的底层逻辑,就是准确把握好从能力驱动向需求驱动转变的拐点,及时调整自身业务战略,满足市场核心需求,从而实现企业发展的蝶变。
2.1 【大厂】AI能力提升推动大厂生态业务增长,亟需寻找AI需求拐点
我们再来看看全球的AI大厂怎么做、怎么赚钱的。
以ChatGPT的发布时间为节点,甲子光年智库将微软、谷歌、Meta的净利润水平曲线做了一个划分。从这个数据图中可以比较清晰地看出来,这几个大厂在ChatGPT发布之前净利润都是处于下行周期的,在这个节点之后全都进入了净利润增长的上行周期,而且一直持续到今天。
右侧是甲子光年智库对比分析的三个大厂在2023年和2024年前三季度的收入结构对比。从中可以看出,Meta和谷歌的收入仍然是以广告业务为主,2024年前三季度微软的收入结构中智能云的提升幅度较大。
从这几个数据可以看出,这轮人工智能浪潮下的全球头部大厂,借助AI能力的提升来推动其核心生态业务的增长,但其本身的AI业务并没有成为其核心的收入来源。大厂重装投入AI后,利润开始出现拐点,但利润的贡献是在核心生态业务,AI本身不挣钱。这些大厂也亟需寻找AI需求的商业化拐点。
2.2 【独角兽】六小虎进入从能力→需求转变的战略分水岭
分析完了大厂,我们再来看一下本轮AI浪潮之中涌现出的创业明星企业。
有六家AI创业公司在业内被称为六小虎,他们分别是百川智能、阶跃星辰、零一万物、月之暗面、智谱AI和MiniMax。
甲子光年智库基于对六小虎的跟踪研究,梳理出了六小虎的业务布局图。通过这张业务布局图的对比,我们可以清晰地看出来,如今六小虎也都在面临战略抉择的分水岭。
过去接近两年的时间中,六小虎在基础大模型和中间层的能力建设方面已经基本完成,接下来六小虎面临的共同抉择就是选择如何从能力驱动向需求驱动转型,如何找到自身业务的商业化闭环。
2C or 2B,是到了该抉择之时!
六小虎的企业之中,有的选择向下探一层,积极布局AI Infra,有的则全面押注C端超级应用,还有的已经全面转向了B端的赋能,更有的选择押注中间层的平台搭建。
不同的人工智能创业企业,选择的拐点方向不同。相同的是,大家都在选择拐点。
2.3 【初创企业-机构】AI Infra是投资机构宠儿,AI应用则是大厂的宠儿
再来看看投资机构对初创企业的关注变化情况。
甲子光年智库发现投资机构之中分出了两股势力,一股是风投机构为主,其投资方向以底层的AI Infra为主,2023年投资数量占比高达83%,到了2024年有所下降,但也仍有69%。
头部大厂这两年里也在频频投资AI领域,其主要投资方向则跟风投机构完全相反,他们主投方向则是应用层的创业公司为主,近两年里应用层的投资企业数量占比为53%。
不过投资机构和头部大厂的投资策略也在进行微调,机构开始逐渐增加应用层和中间层的投资布局,大厂则开始关注AI Infra。
从投资机构的投资偏好来看,也能感觉到现在AI领域的市场割裂之感。到底是要投能力驱动为主的AI创业公司,还是要投需求驱动为主的AI创业公司?从数据看来,投资机构也面临着一个战略抉择。
2.4 【C端产品】全球头部AI企业,纷纷布局C端产品领域
甲子光年智库基于时间轴梳理出了2024年全球头部AI企业在C端产品方面的发布时间表,以及其C端产品的收费模式分布。
从中可以看出,从2024年5月份开始,全球AI企业纷纷密集推出各自C端产品。在统计的27个C端产品之中,44%是免费模式,41%是选择会员订阅制。
现阶段头部AI企业推出C端产品,仍然还在商业模式的探索阶段,探索盈利模式,探索对传统互联网产品的颠覆范式。
2.4 【C端产品】城头变幻大王旗!2024年AI超级应用在哪里?
之所以说如今AI企业还在探索C端AI产品的模式,是因为2024年的AI超级应用的头把交椅处于不断变动之中。
甲子光年智库统计汇总了2024年各月国内AI产品访问量的前三名产品,发现前三名的AI产品是处于不断变动状态的。可以用一句话来形容,那就是城头变幻大王旗。每一个月的前三名产品都是不一样的。
这也为我们带来了一个疑问,2024年AI超级应用在哪里?
2.4 【C端产品】商业化潜力较大的光年象限中,C端应用场景仍然较少
甲子光年智库曾对C端用户不同场景的AI产品做过调研分析,基于NPS值和满意度绘制了这张甲子星空坐标系,以对生成式AI在C端应用场景的商业潜力进行评估。
光年象限之内的场景,满意度高且用户愿意推荐,适合侧重商业化落地的产品场景。光年象限的场景主要有3D交互内容生成、网站创建、聊天机器人、直播带货、数字孪生和音乐生成。
星团象限之内的场景,满意度不高但用户推荐意愿很高,说明产品具有较高的工作效率提升,同时在产品体验方面还需要进一步提升。星团象限的场景主要有翻译、科研学术、海报设计、文本摘要、语音识别、办公、编程与代码自动生成、配合聊天机器人等。
星辰象限之内的场景,满意度高但推荐意愿低,说明产品体验好,对传统产品有了显著的范式颠覆,但对提升工作效率方面有待进一步加强。可惜星辰象限之内,尚无此类场景出现,比较接近此象限的是药物研发、搜索引擎、语音合成、文案创作等场景,但还需要有代表性产品来推动。
星云象限之内的场景最多,也是最需要探索的场景。
从现阶段的场景分布来看,处于光年象限之内的场景较少,大部分场景仍然处于用户既不满意又不推荐的状态。说明C端适合商业化落地的场景仍然较少,需要从供需两端进行深度的挖掘与探索。
2.4 【B端需求】B端用户需求多元且不明朗,2B or 2C需要明确抉择
我们再来看看B端用户情况。
根据麦肯锡的调研数据显示,企业至少在1种业务流程中采用AI功能的比例达到72%,相比2023年的55%有了显著提高。使用生成式AI的比例也从2023年33%提高到了2024年的65%。
虽然2024年企业使用比例显著提升,但从使用场景分布来看仍较分散,主要在市场营销、产品/服务和IT等部门或场景下使用占比较高。
从2024年热门使用场景来看,使用最高的内容支持场景,使用比例也不过才16%,处于第二位的个性化营销则只有15%,再往后的产品设计更是只有10%。
由此可见,B端用户需求多元且不明朗,不同职能部门使用AI的意愿差异较大,应用场景都较分散。未来AI企业如何有效探索B端企业的应用场景,找到真正的商业化闭环,将成为AI企业面临的必解课题。
2.5 人工智能正徘徊在十字路口
2023年建构能力,2024年寻找需求。人工智能已经完成了从飙能力,到找需求的转变。
能力驱动:技术研发为主,实现能力的突破;
需求驱动:商业应用为主,实现需求的商业化闭环。
2024年,无论是大厂,还是六小虎,亦或AI初创企业,都面临着发展战略的抉择。首先,是需要选择继续坚持能力驱动,还是寻找适合向需求驱动转变的拐点。如果需要寻找需求驱动的拐点,那么就需要探索验证C端的超级应用在哪里?B端的落地场景在哪里?
向左,还是向右。此时此刻,所有的人工智能企业都需要做出一个抉择。如何寻找能力驱动和需求驱动的拐点时机,也将成为每个企业的必做题。
人工智能正徘徊在十字路口。
2.6 万千流变,一如既往
商业的本质法门很简单,就是“真需求”,技术的本质价值是为生产力服务。科技企业的本质就是抓住真需求,构建先进生产力,或对传统生产力的短板进行迭代、优化、重构,直至新的生产范式成为主流。
在如今这个万千流变的时刻,每一个人工智能企业都需要确定自己的核心拐点,找准从能力驱动向需求驱动转变的时机节点。让自己的“真能力”锁定用户的“真需求”,然后纵身一跃,坚持走下去。
这也是为何,今年甲子引力年终盛典的主题定位“万千流变,一如既往”。
我们希望,在人工智能面临战略分水岭的时刻,每一个企业都能够准确找到自己合适的战略拐点,然后一如既往地追风赶月下去。
关注公众号「甲子光年」,后台回复“2024甲子引力年终盛典”,获得报告高清版完整PDF。或者点击文末“阅读原文”,进入甲子光年官网下载。
3.存真之路,纵身一跃的节点在何处
3.1 AI改变未来世界科技产业的评估模型
2023年4月,甲子光年智库提出了评估智能新世代的评估指标:“信能比”,反映单位能源所能驾驭的信息量。经过1年时间的持续调研与迭代,甲子光年智库在信能比的基础之上进一步完善了评估体系,在2024年5月提出了全新的评估模型,在信息与能源之外新增一个维度:运动。
能源、信息和运动是现代社会和自然界中三个基本而相互关联的概念——科技的进步,就是三者之间转化能力加强的反映。
【能源与运动:用生产率度量】在传统工业时代,是能源向行为的转化。
【能源与信息:用信能比度量】现代信息技术非常依赖能源。在这个转化过程中,AI影响世界的进程处于L1-L2阶段。
【信息与运动(也可以理解为物理世界的运动):用信产率度量】信息指导行为。在这个转化过程中,AI向物理世界的渗透能力不断提高,这就是L3。
随着AI对物理世界映射能力的不断优化,将会在实践中构建一条AI影响世界发展的动态平衡线。正构建AI与人类共生的双生文明,这就是L4。这个基本框架可以让我们来分析此刻AI及其影响、机会和可持续性。
3.2 AI改变未来世界科技产业的发展进程
基于这个评估模型,甲子光年智库提出了AI改变未来世界科技产业发展进程的四个阶段:
L1-AI生产时代:AI意味着第二生产力,关键是降本增效,推动数字化转型,本质是效率、成本问题。该阶段人类为主, AI为辅, AI对物理世界的映射能力低。AI引发各产业的生产力变革,迎来“工业革命”,大幅提升生产效率。
L2-AI原生时代:AI意味着第二语言,新的交互形式与内容载体。该阶段AI为主,人类为辅, AI对物理世界的映射能力低。AI渗透率将无限逼近直到超越人类在数字世界的生产活动行为边界。
L3-AI创生时代:AI意味着人类之外的第二主体,推动端上智能、软硬结合、世界模型落地。该阶段人类为主,AI为辅,AI对物理世界的映射能力高,逐渐渗透逼近人在物理世界的生产活动行为边界。
L4-AI文明时代:AI意味着第二文明体系。该阶段AI为主,人类为辅, AI对物理世界的映射能力高,人类文明进入“双生时代”。
3.3 开疆拓土 VS 深耕专研:纵身一跃的节点在何处
基于甲子光年智库对四个发展阶段的判断,以及AI能力发展的五个层级的拆分,我们可以探寻到一些纵身一跃的合适节点。
AI生产时代:以苹果为例,在手机产业化后进行创新,然后向需求驱动转型。苹果、比亚迪这类企业属于是模式创新,在原有技术产业化基础上创新后,开始转向需求驱动为主。他们代表的就是AI生产时代,合适拐点在第四阶段,即产业化阶段。
AI原生时代:以BAT为例,均是在互联网成长期发展壮大,是在技术成长期转向需求驱动。这类企业属于跟随战略,技术成长期范式得到验证之后开始转向需求驱动为主。因此,AI原生时代的合适拐点在第三阶段,即成长期阶段。
AI创生时代:英伟达,技术早期就开始转向需求驱动,GPU产品先后为了满足游戏、区块链、AI等需求。它采取的是创新战略,在培育范式期开始转向需求驱动为主。因此,AI创生时代的合适拐点在第二阶段,即构造范式阶段。
AI文明时代:以OpenAI为例,是在坚持技术信仰路线之下看到AI大模型成熟之后,才在近期想要申请转为盈利组织,开始准备转向需求驱动。这类企业是属于能力驱动,技术理想主义,是在技术完全成熟后,才开始转向需求驱动为主。因此,AI创生时代的合适拐点是在第五阶段,即成熟期阶段。
是开疆拓土,还是深耕专研,纵身一跃的节点需要AI企业结合自身赛道所属的发展进程,去评估确定适合自身的转型战略,从而去寻找合适的战略拐点。
3.4 产业链不同环节的人工智能企业纵身一跃的节点
为了帮助科技从业者厘清“不得不”的现实与“真命题”的选择,明确自己寻找战略拐点的节点时机,甲子光年智库从人工智能产业链不同环节、不同发展路径和不同赛道为业内做一些判断。希望能够为AI企业寻找自己的战略节点提供一些参考。
首先,我们来看看AI产业链中不同环节的企业:
酝酿期:算力层中的AI芯片、传感器等相关企业就需要积极拥抱需求驱动,像英伟达那样不断根据客户的实际需求调整产品、技术、战略方向;
构造范式:适合布局应用层的企业向需求驱动转变;
成长期:适合人工智能的中间层企业从能力驱动向需求驱动转变;
产业化:适合人工智能的平台层和算力层中的数字基础设施企业积极探寻从能力驱动向需求驱动转型;
成熟期:适合人工智能的模型层企业积极探寻从能力驱动向需求驱动转型。
3.5 不同发展路径的人工智能企业的战略节点
甲子光年在追踪头部科技企业发展的进程之中,基于评估模型提炼出了四条核心发展路径,并在今年8月份的甲子引力X大会上提出了甲子曲线模型。
不同发展路径下的企业,发展模式往往存在较大差异,其成长周期曲线也呈现出不同的特点。企业在面对未来发展时,不要盲目跟进任何一条曲线,要根据自身特点选择最适合的发展路径。
路径1:能源 → 运动【L0】,是属于传统工业化的发展路径,以生产率提升为主,并不适合人工智能企业选择。
路径2:能源 → 信息【L1-L2】,对应的发展阶段是AI生产时代和AI原生时代,是属于企业数字化的发展路径,可能会走出起伏较大的波动曲线,契合风险资本推动的“大浪淘沙”机制。能源和信息共同作用向行为转化,衡量其生产力的关键维度变为信能比。前期以能力驱动为主,适合在能力的第三阶段成长期寻找向需求驱动转型的时机。
路径3:信息 → 运动【L3】,对应的发展阶段是AI创生时代,是属于智能化的发展路径,未来可能会走出指数级增长曲线,适用于在创新领域具有颠覆性技术或商业模式的企业,衡量其生产力的关键维度变为信产率。前期以能力驱动为主,适合在产业化的初期寻找向需求驱动转型的时机。
路径4:能源 → 信息 → 运动【L1-L3】,是未来产业发展路径,对应发展阶段覆盖了AI生产时代、AI原生时代和AI创生时代,属于新型工业化的发展路径,企业增长曲线适合稳健产业支撑的45°平衡律曲线模式。前期应坚持以能力驱动为主,适合在成熟期寻找向需求驱动转型的时机。
3.6 人工智能各细分赛道不层环节的节点判断
针对人工智能各个细分赛道,甲子光年智库也基于研究洞察给出了不同环节的合适拐点建议。后面,会对这30个赛道一个个给出判断。
4.甲子判断:人工智能领域的30条判断
4.1 AI生产时代【L1】
【判断1】算力迈向超万卡时代
算力一直是支撑人工智能产业发展的基础,大模型训练所需的算力规模指数级增长,对算力基础设施提出了更高的要求。如今,企业训练通用大模型的入门门槛已经提高到了“万卡集群”的级别。
2019年,谷歌的Bert模型只需要8张卡训练7天即可完成,而去年的GPT-4的参数已经接近了万亿规模,其训练使用了2.5万张卡持续了100天的时间。即使是以开源著称的Llama-3也用了2.4万张卡训练了97天才跑了出来。
未来大模型的训练则需要更高规模的“万卡集群”提供支撑,如今头部大厂和各大运营商都在积极建设万卡集群。因此,我们看到“千卡”时代正在快速迈向“万卡”乃至“超万卡”时代,这是一个不可逆的演进趋势。随着超万卡时代的到来,算力集群化与高规格硬件需求将推动算力集群向“四高”领域方向发展:高集群化、高显存、高带宽和高散热。
【判断2】算力已从基础设施走向公共服务,将开启算力即服务时代
受益于“新基建”、“东数西算”等发展机遇,以及爆发式增长的算力需求,我国算力中心建设规模不断扩大。据中国信通院统计,我国在用机架数量近三年复合增长率约 30%。截至 2023年,算力中心机架规模稳步增长,全国在用算力中心机架总规模超过810万标准机架,算力总规模达230EFLOPS,位居全球第二。算力基础设施建设取得显著成效。“东数西算”工程建设也已经取得成果,算力一体化网络基本建设完成。
算力网络建设的完善,将推动算力市场逐渐从“基建”转向“服务”,重点在于实现各节点之间的互联互通和算力统筹调度,实现需求与供给间的精准对接。让算力像水、电一样成为随取随用的公共基础资源。
【判断3】光芯片:光互连成为加速GPU算力集群新选择
算力集群化趋势明显的当下,超万卡集群的发展对高带宽需求日益增加。今年6月,英特尔展现了首款全集成光计算互联(OCI)芯片,能支持64个通道,在每个通道上进行32Gbps的数据传输。更关键的是它的传输距离最远可达100米,有望满足 AI 基础设施对更高带宽、更低功耗和更长传输距离日益增长的需求。
其中的核心就是硅光模块,与传统光电子相比,硅光具备集成度高、成本低、功耗低等显著优势。根据测算,硅光模块的光源成本相比较传统分立式方案能够大幅降低10-20%的成本。
随着光芯片和光互连技术的不断进步,光子计算逐渐具备可行性和高效性,成为加速GPU算力集群的“新选择”。光芯片和光互连不仅解决了电子互连的瓶颈问题,还能在保证性能的同时降低能耗,尤其适合大规模分布式计算任务。它们成为了加速GPU算力集群的新选择,能够有效提升集群的计算效率,推动大规模计算任务的进一步发展。
【判断4】AI终端推动端侧算力需求增加,端侧NPU成为新热点
2024年可以称为AI终端的爆发元年。根据IDC的数据预测,AI PC的发货量将达到2100万台,AI手机的发货量将达到1.9亿部。除了AI手机、AI PC之外,各类智能家居设备、可穿戴智能装备等都在尝试集成AI功能。
AI终端出货量和用户实际需求的增加,进一步推动端侧算力需求的激增。传统的CPU+GPU的终端算力架构,已经无法满足生成式AI需求的增长,这些设备需要更高的算力来支持复杂的AI任务。
NPU作为专为AI设计的处理器,具有大量的计算单元和高带宽的存储架构,能够显著提升AI计算能力并降低功耗。CPU+GPU+NPU异构方案,将会成为适配端侧运行AI算力需求的全新架构。
“周易”NPU是安谋科技针对深度学习而自研的人工智能处理器,包括完整的硬件IP和Compass软件平台,目前已迭代了Z系列和X系列等多款产品。其中,Z系列主要面向AIoT市场,为物联网设备提供AI算力支持;X系列则主要面向车载、边缘计算等高算力场景,大幅提升计算效率。
面对算力需求的爆发性增长,即将推出的新一代“周易”NPU将在承袭前代产品强算力、易部署、高度可编程等优势的基础上,更在通用计算上实现了全面升级。该NPU现已适配Llama、Stable Diffusion、通义千问等主流大模型,助力高性能AI计算。
【判断5】预训练大模型从百模大战走向寡头垄断
2023年,在ChatGPT掀起大模型热潮后,中国企业打响了“百模大战”,各类玩家争相涌入,其中不乏优秀的竞争者。根据甲子光年智库的统计数据显示,仅去年8月发布的大模型就达到了43个,是这场大战的顶峰。但是到了2024年特别是下半年,每月发行的大模型不足十位。
今年业内讨论更多的不再是大模型,而是具体的应用场景和应用产品。从过去平均每月发行数量超过20个大模型,到如今平均每月不足5个大模型,愿意继续布局并持续投入高成本训练及调试大模型的企业开始逐渐减少。
Grand View Capital北美合伙人Richard Xu日前发文指出,海外还在做预训练的基础模型公司也只剩5家:OpenAI, xAI, Meta, Google, Anthropic。
在经历了大模型的百花齐放之后,基础大模型领域将会进入行业调整期,未来真正能够坚持做预训练基础大模型的公司会逐渐减少,最终进入寡头垄断的竞争格局之中。
【判断6】算法变革元年,寻找非Transformer架构的算法最优解
人工智能的核心三要素,算力、算法与数据。在算法层面,本轮AI浪潮之中,Transformer架构凭一己之力撑起了整个AI变革的全部江山。但随着模型规模的扩展和需要处理的序列不断变长,Transformer的局限性也逐渐凸显,比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长,对算力和数据的依赖导致其面临发展瓶颈。
为了克服这些缺陷,也为了探索更多的生成式AI技术架构,甲子光年智库观察到有大量的研究者们正在积极探索非Transformer架构的新算法。
让我们欣喜的是,2024年有一些新架构模型在能力测试方面已经有了突出的表现。一种新的开源Mamba模型——Falcon Mamba 7B,能够比当前的 Transformer 模型适应更大的序列,同时理论上能够适应无限的上下文长度。
另一种新架构模型LFM(Liquid Foundation Model),超越了同等规模的Transformer模型,如Llama 3.2。它用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。其小巧便携的特性使得它能够直接部署在手机上进行文档和书籍等分析。
因此,甲子光年智库判断,2025年将会是算法变革的元年。未来最适合人类使用的大模型,可能会是非Transformer架构的算法模型。我们亟需寻找非Transformer架构的算法最优解。
【判断7】o1:推动AI“深思熟虑”地“归纳世界”
今年9月,OpenAI推出了他们最新的大模型o1。o1模型在作出回答之前会像人类一样“深思熟虑”,用时约10-20秒,产生一个长内部思路链,能够尝试不同的策略并识别自身的错误。
思维链是一种帮助AI模型进行推理的技术。它通过让模型在回答复杂问题时,逐步解释每一步的推理过程,而不是直接给出答案。因此模型在回答问题时就像是人类在解题时那样,先思考每一步的逻辑,再逐步推导出最终的结果。
思维链让o1模型在物理、化学和生物学等领域具有挑战性的基准任务上的表现与博士生类似。在国际数学奥林匹克中,GPT-4o 只正确解决了 13% 的问题,而o1模型解决了83%。对于复杂的推理任务来说,这是一个重大进步,代表着人工智能能力的新水平。
据OpenAI的联合创始人之一格雷格·布罗克曼介绍,OpenAI的模型原先进行的是系统一型思维(快速、直观的决策),而思维链技术则启动了系统二型思维(慎重、分析性的思考)。系统一型思维适合快速应对,而系统二型思维则通过“思维链”技术,让模型能够逐步推理解决问题。
o1大模型的成功,进一步验证了强化学习训练模型的技术路线。思维链的使用,让大模型学会三思而后行,推动AI开始“深思熟虑”地“归纳世界”。
【判断8】单元大模型,推动AI终端走向群体智能
2024年,越来越多的AI企业开始将目光聚焦在小语言模型,开始关注AI算法模型的实际应用与落地。大模型、小模型的性能已经不再因为自身训练数据的大小体量而出现显著的代差。如今小语言模型在生产制造等不同场景的应用已经越来越受到重视。
AI处理的重心也不再依赖云端智能算力,而是开始向端侧转移,这催生了设备单元大模型的新需求。通过预训练与微调、知识蒸馏、数据集增强优化等措施,单元大模型在特定任务上的表现可能甚至会优于预训练大模型。单元大模型可以广泛适配不同的AI终端,将各类AI终端连接起来,形成群体智能。
举个例子,RockAI在大模型领域以“群体智能”的理念构建通用人工智能技术,以自研国内首个非Transformer架构、非Attention机制的Yan架构通用大模型为基础,致力于打造群体智能单元大模型,推动群体智能的变革,实现AI普惠。
【判断9】数据标注将成高质量中文数据集建设的重要手段
互联网高质量数据集已经濒临用尽,且全球通用的50亿大模型数据集中,中文语料仅占1.3%。一些主流数据集如Common Crawl、BooksCorpus、WiKipedia、ROOT等都以英文为主,最流行的Common Crawl中的中文语料也只占4.8%。
近期,一家来自中科院深圳先研院、中科院自动化所等机构、高校的团队从中文互联网的各大平台直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的清洗和人工审核,打造成高质量、多样化的中文指令微调数据集COIG-CQIA。用该数据集训练零一万物Yi系列开源大模型后,其测评得分都有大幅度的提升。
因此,通过数据标注手段,将各种中文互联网数据源进行清洗和人工标注,将成为构建中文指令数据集的一种有效途径,可以快速弥补中文数据集缺乏的困境,可能会成为建设高质量中文数据集的重要手段。
【判断10】数据空间,让数据流通起来的新起点
无论是数据标注,还是高质量中文数据集的建设,都需要让这些数据流通使用起来。
今年4月,数据局在全国共7个省份进行了国家级数据标注基地试点。在发展本地数据标注产业的同时,也通过数据要素创新中心等机制保障数据流通的安全性与规范性。基于区块链、隐私计算等新兴技术,数据标注成果被嵌入到可信的数据空间中,在全国范围内形成可追溯、可信任的数据流。
可信数据空间,已经成为支撑构建全国一体化数据市场的重要载体,是让数据流通起来的新起点。
【判断11】Agent重构软件形态,多智能体协同推动业务智能化场景落地
今年Agent是人工智能领域的宠儿,根据调研数据显示,1%的企业已经实现常态化应用AI Agent,15%的企业已将AI Agent成熟运用于某一具体业务流程,84%已在进行试点或正在制定计划。这说明,越来越多的企业开始考虑以Agent为主要抓手,推动企业数智化转型升级。
另外,企业应用Agent已经开始迈入多智能协同的阶段,不同业务场景、不同应用方向之间,开始相互串联融合,以多智能体协同的方式重塑传统的IT软件形态,推动企业进入AI助理时代。
举个例子,神州数码自研的AI原生赋能平台“神州问学”,除了能以Agent能力,重塑数据分析流程,实现与私域知识和业务相结合,还能为企业打造算力-模型-数据-应用的全链条AI Agent应用平台,助推企业级数智化进程。
【判断12】AI Infra ,算力供需矛盾催生出的新兴赛道
最近一两个月,AI Infra的概念比较火。
本质原因还是来自于国内算力资源分布的不均衡导致的。根据甲子光年智库的统计数据显示,国内的算力资源存在明显的“贫富差距”现象。总共约有十多万张 A100 和 H100在使用,但配有万卡集群的只有头部三四个玩家,超过50%的算力资源集中在头部大厂,而剩下一部分则分散在三五百家不同的中小型企业、园区及金融机构中。
算力供需的矛盾,导致算力分散化,大量算力未集中用于大模型训练,不仅造成了算力资源闲置,也限制了算力资源能力的发挥。算力与应用中间,需要一个中间商来提供服务赋能,AI Infra正是一座桥梁,一端连接硬件,另外一端连接上层应用,把这两端连接起来,让大模型更好地运行在芯片上。
AI Infra对于算力生产者一方,可以帮算力中心把超大规模的集群给利用起来。从商业角度上来讲,能够提升算力中心的市场竞争力;从社会角度来讲,相当于提升算力资产的整体利用率,减少资产闲置现象。
对于算力消费者,也就是AI应用侧,AI Infra则通过高性能的大模型推理引擎,可以在同样的硬件平台上把硬件运行得更快,缩短模型的运行时间。既改善了用户的体验,也减少了AI消耗的算力成本。
2024年已有多家AI Infra企业获得了融资,其中就包括零一万物、无问芯穹等一众明星企业。AI Infra有望成为本轮探索应用场景浪潮下催生的第一个重要新兴赛道。
【判断13】AI SaaS的新十年,企业智能化管理从AI合同开始
企业数字化转型经历了漫长的发展演进,从最早的流程信息化到业务数据化,再到产业的数字化,如今已经到了迈向智能化的阶段。企业数智化建设,既需要“降本增效”,也需要“创新”,需要实现数字化基础能力、组织管理、生产运营、产业协同的整体能力体系建设。
大多数企业在进行数智化转型升级的过程之中,都会面临无处下手的困境。企业需要寻找一个通用的场景作为切入口,实现覆盖业务流、数据流、资金流的三流合一,以小切口进入,逐步构建完整的数智化能力体系,从而推动企业整体实现转型升级。
合同管理就是这样一个小切口大应用的场景,举个例子:
e签宝是国内领先的电子签名服务商,始终坚持SaaS +AI 的战略方向,2024年,e签宝率先发布了行业内首个自主研发的合同大模型,不仅在多个关键指标超过主流通用模型,还全面覆盖了从合同风险评估、审批流程优化到最终签署及后续管理等各个环节,为企业提供了好用、安全、全链路的合同智能化SaaS。
未来将是AI SaaS的新十年,企业智能化管理可以考虑从AI合同切入,推动企业整体转型升级。
4.2 AI原生时代【L2】
【判断14】C端市场已经开启流量争夺战
首先我们来看C端产品。在C端市场,一场围绕新用户的流量争夺战已经打响。
根据AppGrowing的数据显示,在2024年的第三季度里,Kimi、豆包都花费了较高额度进行流量推广。
根据百度指数的C端产品搜索热度来看,如今豆包和Kimi已经成为C端产品中的第一梯队,远远超过了其他C端产品的热度指数。
但随着更多大厂先后开始落子布局C端产品市场,未来的流量争夺战将会进入一种白热化阶段。C端产品有可能会重蹈互联网产品的老路,开启流量为王的时代。
【判断15】价格战背后是商业变现的焦虑
与C端产品的流量争夺战相对应,2024年各大人工智能企业纷纷大幅降低了自身的服务价格。
自OpenAI在今年1月发布的GPT-3.5 Turbo降低了50%的输入价格,谷歌发布Gemini 1.5 Flash将输入价格定位0.35美元/百万tokens,游戏的性质就已开始发生变化。
国内的大模型厂商也纷纷开启了降价模式。根据Gartner的统计数据显示,国内主流大厂的降价幅度最低是35%,最高则达到了100%。
先是流量争夺,后是价格战。这背后反应的是人工智能企业面临的困境,即如何找到商业化的闭环,如何实现从能力驱动向需求驱动的跨越。
价格战的背后,本质是商业变现的焦虑。
【判断16】GPTs倒下了,AI Store的故事还在继续
我们再来看 AI Store。作为AI产品的发布平台,每一家大厂都在悄悄布局自己的AI Store应用平台。
该领域的先驱者OpenAI,其GPTs在发布两个月之后就已经倒下。据Similarweb网站数据显示,在2023年11月初奥尔特曼官宣GPT Store后,其平均每月访问量为4280万次。而到2024年1月9日正式发布前,这一数字降至约 640 万次,访问量流失了将近40%。
GPTs虽然倒下了,但全球的AI大厂却在积极地拥抱AI Store,苹果、微软、字节、百度、腾讯、阿里云、360等国内外的AI大厂也都先后推出了AI Store产品来打造应用生态。
AI Store的故事的还在继续。
【判断17】AI搜索有望成为下一个真正的AI超级应用
说了这么多的AI产品,那么真正的超级应用在哪里呢?甲子光年智库也观察到了几个有潜力的方向,在此跟大家分享。
首先,就是AI搜索。
根据甲子光年智库的调查数据显示,如今用户对当下AI搜索引擎的标准满意度是67.8,也就是处于不满意状态。NPS净推荐值则是-6.1,处于不愿意推荐的状态。这说明当下的用户对AI搜索产品是不满意且不推荐的状态。当下AI搜索引擎的功能尚无法满足实际需求,对工作赋能方面未达预期,故而不愿推荐。这与用户反馈的AI搜索引擎生成内容准确率仅为54.2%有关系。
但与此相对应的是,SimilarWeb数据显示,十大主流AI搜索产品web端周访问量是处于快速提升状态的,从第18周的400万量级,已经突破到了第45周的千万量级。
这说明用户对AI搜索的需求是十分旺盛的。但现有的AI搜索产品仍然不足以满足用户的实际需求与期望。
AI搜索,有望成为下一个真正的AI超级应用。
【判断18】AI代码让产品开发进入自然语言交互时代
根据调研数据显示,开发者认为编写代码是开发工作中最耗时的任务。因此,AI代码生成工具一直是各大厂积极布局的应用场景之一。
按照代码生成的比例分布可以把AI代码生成划分为5个阶段,如今正处于从L2研发助理向L3智能体组合过渡的阶段,标志着编程能力从单点支持走向多智能体协作的深度演进,即将实现80%以上的代码生成。
未来,AI代码生成有望实现自然语言交互方式的代码编程,将复杂的开发流程简化为清晰的阶段性操作。通过提示词交互的方式,开发者可以澄清需求,将模糊描述转化为可执行目标,随后制定计划,生成代码,反复交互测试迭代,最后通过调试与运行完成最终生成的产品。
AI代码生成工具有望重塑产品开发范式,让产品开发进入自然语言交互时代。
【判断19】视频生成从短视频走向长视频,从生活场景走向专业场景
AIGC视频生成技术在不同形态的视频内容领域的应用进程各不相同。
概括而言,长视频领域AIGC视频生成技术仍然处于L1阶段。由于现阶段AIGC视频生成技术的局限性,导致一些具有高度专业性的领域仅仅将AIGC作为生产工具,比如为电影、剧集等提供素材来源,尚无法带来颠覆性重塑,但会压缩原有产业链。而对于新闻这类需要高度准确性的内容,暂时只能满足情景复现等少量场景。
短视频领域则首先面临AIGC视频生成技术的颠覆,将会进入L2即AI原生时代。短视频产业链在未来将不复存在,AI原生的短视频模式和平台有望随之诞生。
但随着视频生成技术的不断完善,我们欣喜地看到首部AI电影、首部AI长剧、首部AI动画等先后问世,在人机共创模式下实现了制作成本的大幅度下降。
AIGC视频生成技术的应用,正在从短视频领域向长视频领域渗透,从普通的生活记录短片场景向着影视等专业内容制作场景渗透。
【判断20】AI体验营销,重塑营销理论与流程,推动营销管理思想变革
在企业的应用场景之中,营销场景是生成式AI应用最为频繁的场景。
过往,市场营销学更多聚焦基于理性购买行为的研究,因此产生了传统的营销4P、4C、4R等理论。在进入体验经济时代之后,则产生了符合诱导消费者冲动性购买行为的营销理论,即体验营销理论。
随着数字技术、AI技术的广泛应用得到升级,消费者的行为也发生了本质变化,过去的体验营销理论也已经无法指导智能新世代的营销策略制定。
因此,甲子光年智库在2024年提出了AI体验营销的理论,希望打造智能新世代的营销理论体系,以AI体验营销重塑营销数字化的全链路。
AI体验营销正在革新传统的营销全流程,它通过赋能策略洞察,精准捕捉用户需求;采用创新的内容生产技术,构建富有创意的互动方式;运用智能化广告投放,实现个性化的广告定制;推动多渠道整合,创造无缝的用户体验,并实现实时的客户互动,提供持续的个性化服务。
这种全方位的重塑不仅极大地提升了客户体验,还增强了品牌与消费者之间的深层联系,为企业在竞争激烈的市场中提供了强大的竞争优势。
甲子光年智库认为,生成式AI对营销管理的重塑是全面的,从底层的基础营销理论到营销策略的制定,再到营销推广的流程和范式都进行全面的重塑,将会推动营销管理思想的变革和范式更新。
4.3 AI创生时代【L3】
【判断21】AIfor Science:AI改变科技,科技改变生活
AI对科研的赋能一直AI技术的重要应用方向。今年的诺贝尔物理学和化学奖都颁发给了AI领域的科学家,这标志着AI与基础科学深入融合时代的到来。
根据调研机构Precedence Research的数据显示,2022年全球生命科学人工智能市场规模价值15亿美元,到2032年将达到约91.7亿美元,2023年至2032年的年复合增长率为19.90%。
AI for Science将极大加速和扩展科学研究的效率和能力边界,重塑科研范式。甲子光年智库认为,未来AI对人类的影响,有可能会通过改变科学技术的研究范式,来实现对实体经济的生产范式的重塑,进而实现满足人类的需求,最终达到改变人类生活的目的。
因此,未来AI推动社会发展的循环逻辑,可能是AI改变科技,科技改变生活。
【判断22】AI改变医疗范式,从“被动治疗”走向“主动健康”
医疗是当下AI应用的另一个重要领域。
传统医疗理念和AI时代的需求并没有偏离,医疗最终的追求就是治愈疾病。随着文明和技术的进步,在治愈过程中,人文关怀、精神诉求、就医体验不断被提出。但这些不是最终目标,疾病治愈的目标从未改变。
AI技术对传统医疗范式的改变,是扩大了医疗服务的流程和范围,将过去比较注重诊中环节,扩大为诊前、诊中、诊后并重的状态。从“以治病为中心”转向“以健康为中心”,从“被动医疗”到“主动健康”,实现精准治疗、个性化诊疗和康复;全人群、全方位、全生命周期的医疗健康服务,让人民群众少生病、不生病。
【判断23】具身智能的未来在工厂
不管是OpenAI投资的人形机器人公司1X,还是英伟达的黄仁勋直言AI下一个浪潮将是具身智能,都带动了这个概念的火爆。
在甲子光年智库看来,当下具身智能的核心应用场景仍然是在制造业,在智能工厂之中。根据Markets and Markets预测,制造业人工智能的市场规模将从2023年的32亿美元增至2028年的208亿美元,年复合增长率达到45.6%。中国工业机器人安装量一枝独秀,2023年安装量高达27.6万台,占全球安装总量的51%,未来还会保持一个较高增速。
具身智能可以使得数据决策层—生产计划层—数据监测层—现场管控层—设备层打通,重构智能工厂的数据与生产业务流程。打通智能工厂的纵向管理体系,实现管理决策、数据采集与生产执行的完美融合。
因此,甲子光年智库认为,具身智能的未来在工厂。
【判断24】手机+智能体,AI手机的新形态
端侧计算能力提升使得AI模型从云端逐步转移到设备端,实现了更强的本地处理能力。这推动AI手机成为今年的热门AI终端产品之一。
根据Canalys的调查,消费者对AI手机的倾向直属比例超过25%,93%的消费者对AI手机有倾向性。AI手机的出货量占手机整体出货量的占比会从2023年的5%,快速提高到2027年的47%。
AI手机有望成为重塑手机市场格局的核心角色。各大手机厂商在2024年都积极推出自身的AI手机产品,但除了从硬件领域集成NPU芯片之外,更多的动作是集中在软件层面。手机与智能体的结合,成为各大厂商探索AI手机的重要发展路线。
未来的手机操作系统,有可能会走向智能体化。
【判断25】AI新物种,AI PC将成用户的个人AI助理
AI PC作为AI新物种,一经提出就迅速成为AI终端中的热门产品之一。根据科纳仕的调研数据显示,AI PC作为AI新物种,其用户接受度在快速提升,未来三年AI PC将成为大众化产品。
面向B端的AI PC需求也会快速增长,到2027年,面向B端的AI PC占比将达到59%。AI PC高效能和定制化的工作流程,以及来自各种专业领域的需求,如金融分析、设计创作、医疗研究,都抓住了B端客户的核心需求。
联想在业内率先定义了AI PC,强调其具备五大特性:内嵌个人大模型与自然交互的个人智能体、内嵌个人知识库、本地异构AI算力(CPU/GPU/NPU)、开放的AI应用生态、保障个人隐私及数据安全。这是联想在中国引领家用电脑、互联电脑两次代际升级之后,第三次引领PC代际升级。AI PC将成用户的个人AI助理,开启从PC到“CP”的新纪元。此外,联想还研发了天禧个人智能体系统(天禧AS),从AI PC扩展到多种AI终端,推动设备间智能协同工作,为用户提供全场景、无缝联接的AI体验。
【判断26】XR:开启AI元宇宙的核心载体
人类传递信息的内容载体形态一直在不断演变。从过去的线下交互,到网络时代的线上,再到AI创生时代的实时与沉浸交互。
与交互形式相伴随的则是内容的承载形态和平台。从最早的文字,到文字+图片,再加视频,如今在AI创生时代,则变为可交互、可编辑、可定制的视频语言。内容形态和交互的变迁,带来的则是内容承载平台的变迁,过去是由互联网、视频平台等承载。未来的内容承载平台,应是AI元宇宙。
进入AI创生时代,AIGC加速了元宇宙世界的内容构建,开启内容形态的AI元宇宙时代。AI元宇宙是一个完整的生态体系,需覆盖数字世界和物理世界。XR,则是数字与物理世界的连接器,是AI元宇宙生态体系的核心中间层。
蔚领时代是专业的实时云渲染解决方案供应商。将目标瞄准未来的虚拟世界,蔚领时代判断下一个互联网时代的本质将是“可视化升级”,而XR则是通往下个时代的的重要入口。蔚领时代在2024年9月发布全球首部基于Vision Pro进行制作的,全虚拟剧情向的交互式视听作品《春草传·青与白》,以突破性的全息云串流技术,探索了未来沉浸感、交互性的体验方式。未来蔚领时代会以《春草传》为模板,将所有技术能力整合于一套云端开发者OS,开源工具、引擎和方法论,以平台标准化能力帮助开发者实现算力解放,以想象力为支点,创造定义下个时代的内容。
【判断27】端到端自动驾驶渐行渐近
端到端自动驾驶技术的发展遵循着渐进的路径。目前,BEV+OCC+Transformer已经实现了感知模块的端到端架构,决策模块也在逐步从依赖手写规则向基于深度学习的模式转变,最终目标是实现模块化联合或单一模型的端到端自动驾驶。
业内专家对端到端技术路线持有信心。根据辰韬资本的调研数据,79%的专家预测端到端自动驾驶会在5年内落地,46%的专家则认为端到端自动驾驶可能会为行业带来新的巨头,这将是一个巨大的发展机遇。
甲子光年智库观察到很多汽车主机厂也在积极布局端到端自动驾驶领域,研发推进多模态智驾大模型的落地与实践应用。端到端驾驶从感知走向决策,底层算法的不断创新和完善,以及车载芯片的持续迭代升级,预示着汽车领域的颠覆性改革已然箭在弦上。
大卓智驾多模态智驾大模型是一种集视觉、听觉、文本等多模态信息于一体的大模型技术,把它用到智能驾驶上,它就能像人类一样“看”懂并理解各种复杂路况,并做出合理的应对,也能“听”懂人类自然语言指令,并通过强大的通识能力和推理能力来准确执行指令。有了智驾大模型的加持,AI司机将变成真正聪明的老司机,具备强大的理解能力和执行能力,为智驾体验带来质的变化。
4.4 AI文明时代【L4】
【判断28】AI交互重塑人机协作分工模式
人机协作分工模式,一直是当前人类利用科学技术提高生产力的根本模式。当前的人机协作,主要角色还是两个,即人与机器。
人在协作之中负责感知、决策处理和指令输出,机器负责处理和输出。早期的人机协作交互主要是以图形为主。
从2016年之后,人机协作的方式开始出现变化,出现了人与AI的交互,代表性技术就是XR、AI和元宇宙,这时人机交互仍然是以人和机器为主,但交互形态变为了在线实时交互。
随着生成式AI的到来,人机协作方式进入到了自然语言交互的阶段,开始出现了AI与机器的交互协作方式,未来随着工业大模型和智能体的广泛应用,可能会推动交互方式进入到AI与AI交互协作的模式。
在未来十年,有可能会进入AI机器与AI机器的交互,人机交互的协作模式,彻底从人与机器交互变为了人、AI、机器三者的交互协作分工模式。
未来,我们可能会进入AI主导的人机协作分工新范式之中。
【判断29】AI主语化,人类主导权在逐步让渡
人机交互协作行为的变迁会导致社会角色和分工的改变,从而影响到信息传递的载体形态。在视频生成技术日益普及和发展的背景下,视频形态变得更加可交互、可编辑和可定制,这种变化使得信息传递的形态更加多样化和灵活化。随着信息传递内容形态的变化,人类的认知和观念也会随之发生改变。具有相同认知观念的人群可能会因为共享相似的视频内容和信息,逐步形成新的文化圈层。
AI的主语化,将预示着人类社会与文明的全面重塑。这一过程将引发人类行为、角色与分工、语言形态、认知观念全面变迁。这场变革不仅改变了人类的社交模式,推动数字科研的发展,加速了世界模型的构建,为人类社会进入一个新的时代铺平了道路。
但同时,AI主语化也意味着人类的主导权在逐步让渡。
【判断30】人择世界,决定AI文明的发展上限
波普尔的世界三元组描述世界的三个基本要素:物理世界、心灵世界和符号世界。若人类文明的演进,进入到人类文明与AI共建共生的“双生文明时代”,符号世界和物理世界将被AI大幅度理解和重塑,心灵世界成为人类最后的坚守。
AI主导的是符号世界,AI通过符号世界改变物理世界的方式是世界模型,改变心灵世界的方式是无限的创意和想象。
人类主导的是心灵世界,人类通过心灵世界理解物理世界的方式是眼耳鼻舌身意,改变符号世界的方式是创造了AI。未来,符号世界和物理世界将被AI大幅度理解和重塑,心灵世界将成为人类最后的坚守。
AI主导的符号世界,会让信息呈现爆炸式的内容增长曲线,表现为I曲线的无限性。但在无限的信息之下,真实有用的,去重去水去伪后的信息,才是真正具有价值的知识。知识增长的曲线将会是一个有限曲线,即R曲线。
R有限的知识曲线之中,可以被人类理解吸收的知识会为有限,即H人类知识曲线,也被称为“人择世界”。不管信息多么爆炸式的无限增长,人类可以理解并吸收的知识,成为决定了AI文明发展的上限。
人择世界,应该成为决定AI文明发展的方向。
在这一前提之下,我们方才能够去思考,通往AGI的路线如何去走。
在这一前提之下,我们方才能够去思考,AI文明时代下AI与人的关系、AI与经济的博弈、AI与ESG的关系。
注:文/甲子光年,文章来源:甲子光年(公众号ID:jazzyear),本文为作者独立观点,不代表亿邦动力立场。
文章来源:甲子光年