迈入第三年,全球大模型的竞逐正迎来一个新周期。
一面在技术层,随着OpenAI相继发布o1和o3模型,一场推理竞赛已在模型厂商间展开;另一面在竞争侧,在“应用落地”的集体共识里,大模型的竞争格局发生新的松动。海外,一批如Character.ai的明星公司已被大厂收购,巨额融资越来越集中在头部公司。
国产大模型也出现类似的趋势。互联网大厂凭借技术和云厂商的生态优势,依旧遵循“产模一体”的路径,创企则出现了新的分化,开始做起减法,比如零一万物不再追逐超大模型,将部分技术团队并入阿里,百川智能则转向to B医疗......
分化与洗牌中,横亘在国产大模型面前的还有一道无法绕开的关卡——算力。
2018年至今,围绕人工智能和芯片制造,美国多次加码对华芯片管制措施,呈现出更动态、更精准的特点。今年1月13日,拜登政府卸任前发布《人工智能扩散暂行最终规则》,根据BIS发布的新规,在加码限制高算力先进GPU出口的同时,限制范围也再度扩大。
以出口管制卡住中国大模型的算力脖子,是美国政府的一场“阳谋”,而把牌握在自己手里,寻找国产化的解决方案,这也是国产大模型必须要走的路,此前科大讯飞董事长刘庆峰就曾反复表示:“中国大模型只有在国产技术底座上发展,才能有自主可控的大未来。”
但这条国产化之路究竟该怎么走?结合大模型的前沿趋势和科大讯飞等企业的实践,我们或许能找到一些确定性的解题思路。
解法一:深度推理竞赛争夺:
比深度,也要比广度
随着OpenAI扣动推理模型的扳机,大模型浪潮的技术范式已从预训练的Scaling Law转向推理端,从“快思考”转向“慢思考”,国内外科技公司的新目标无疑是更快抢夺推理模型的“船票”,追平与OpenAI的差距。
从谷歌发布Gemini 2.0 Flash Thinking,到月之暗面、DeepSeek、智谱、阿里云、科大讯飞等国内大模型厂商相继发布各自的推理模型,一场推理模型的新竞赛已经开始。
但想要吃到新技术范式的红利,并非那么简单。大模型厂商需要解决的核心问题有二:一是模型的深度是否足够深,即在数学等复杂领域问题上能否达到人类专家水平;二是模型深度能否泛化至其他领域,应用于更广的行业。
也就是说,推理大模型的深度和广度都很关键。
在模型能力的深度上,数学题就是最好的试炼场。以科大讯飞近期发布的星火深度推理模型X1为例,其在小初高(含竞赛)、大学(含竞赛)、AIME、MATH500等多项考试中,取得了亮眼成绩,得分水平处于业界第一梯队,且多项指标国内第一。
事实上,早在2023年,科大讯飞的通用底座模型讯飞星火就在《MIT科技评论(中国版)》的一场公开透明测试中以超出平均得分率20%的成绩被评为“最会算数”的大模型。而就在国产大模型赶超o1系列时,OpenAI却深陷“o3成绩造假罗生门”。据外媒最新报道,o3在数学基准FrontierMath中的惊人表现很有可能是提前得到了大部分数据集。
过往科技史已经证明,一切的技术炒作最终都会回归应用和落地,深度推理模型的竞赛也不例外,除了深度水平外,推理模型只有落地于刚需场景,解决普通人的日常问题,才能真正体现“慢思考”的技术价值。
「硅基研究室」观察到,目前国内大模型企业的深度推理模型版本迭代还在陆续发布中,但在行业侧的落地明显速度更快,例如讯飞星火X1已在教育、医疗等真实场景中实现了应用落地。
在教育场景,去年科大讯飞曾联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手。而X1目前已部署上述产品,在内测期就收获老师们的好评。X1还将与讯飞AI学习机结合,升级这一AI硬件产品的学习推荐和诊断等能力。在医疗场景,X1模型可让专科辅助诊断和复杂病历内涵质控的准确率达到90%,为今年上半年即将发布的讯飞星火医疗大模型升级提供底层模型能力支持。
左手技术赶追OpenAI o1和o3,右手前置模型落地,在深度推理模型这场竞赛中,国产大模型依旧有弯道超车的机会。
解法二:大模型商业化落地:
要专注优势,更要规模复用
紧追前沿技术风口外,商业化是国产大模型的另一重机会。
过去一段时间来,围绕大模型的讨论已从“谁又融到资了”转变为“谁先赚到钱了”,为了寻求更快地商业化落地,在B端,云厂商大打价格战、创企争夺更多的硬件入口,大厂则在C端比拼投流获客,但商业化困境依旧摆在眼前。
但并非没有优等生给出可供参考的解法。
在B端,据第三方机构「智能超参数」统计,2024年,科大讯飞以91个中标项目成为2024年度标王,在大模型拿单江湖上走出一条“讯飞之路”;大厂中,始终坚持开源路线的阿里云,发挥流量优势和人才优势的字节跳动,在C端的商业化上也都交出了一份不错的成绩单。
复盘它们的大模型商业化之路,有两个关键点:一是要专注自身的优势,二是要更快实现规模化复用。
首先,大模型商业化并非是盲目狂奔,拿着锤子到处找钉子,而是专注自身的优势,做更擅长的事。
以科大讯飞为例,在AI 1.0时代,作为率先探索和落地商业化的AI企业,科大讯飞就已沉淀下B、G端的行业know-how,其AI能力在教育、医疗、金融等领域和央国企中就受到了认可。
而在AI 2.0时代,这些优势被科大讯飞进一步延续和放大,为其大模型商业化落地提供了好的基础条件。在all in大模型这件事上,科大讯飞坚持“1+N”战略,“1”代表大模型算法研发及高效训练底座平台,而“N”则代表应用于教育、医疗、办公等多个领域的专用大模型版本。每次升级核心底座的时候,“N”也都会有相应的升级。
科大讯飞研究院院长刘聪也曾在采访中表示,科大讯飞做AI的一大特点是:“内部 AI核心技术和业务之间逻辑是对齐的”,由于经历了AI从技术驱动到应用场景驱动的完整周期,因此科大讯飞对AI落地行业有着更为务实和深刻的理解。
截至2024年10月,科大讯飞已与各头部企业共建了20多个行业大模型,覆盖超300个应用场景,这些头部企业中包含了中石油、中国移动、中国海油、交通银行等央国企。
针对一些实体产业,例如汽车行业,科大讯飞已和奇瑞、广汽、长城、长安等七大车企探索落地“汽车+大模型”创新,据艾媒咨询数据,中国汽车出海十强企业中,有8家企业应用了科大讯飞的智能语言技术。
其次,大模型商业化比拼的也并非是最贵的技术,而是站在企业成本端,提供更具性价比的全套解决方案,并在行业中快速复用实现规模效应。
刘庆峰曾提到:“每个企业搭建后,我们都会找到很多可复用的给其他企业。很多央国企头部企业在这个行业做完后,可推广给全行业,也可以在不同行业相互借鉴。”
实现规模化复用的背后,针对大模型落地,科大讯飞自上而下建立了一套“建算力、理数据、训模型、落场景、保安全、精运营”全套解决方案,由此能快速落地千行百业。
在“建算力”上,科大讯飞早在2023年就与华为联合打造了中国第一个万卡算力集群“飞星一号”,讯飞星火也是国内首个由全国产算力平台训练出的万卡算力通用大模型。
在“理数据、训模型”上,科大讯飞以“通专结合”的方式,为行业提供更具性价比的模型解决方案。如科大讯飞此前和中国石油、中国移动、华为共同打造了能源行业大模型——昆仑大模型,该模型就以通用大模型搭配不同尺寸、不同类型的专业大模型,满足了能源化工行业不同业务的场景需求。
从科大讯飞的商业化实践中不难看出,专注自身优势,才能将行业做深做透;坚持模型的性价比理念,才能让更多企业从“用模型”迈入“用好模型”,这是大模型商业化的正道。
解法三:大模型国产化:
持续为世界提供第二选择
算力、算法和数据是AI时代的三要素,一个行业共识是,国产大模型不缺算法和数据。一方面,中国完备的产业生态提供了广阔的应用场景,移动互联网时代沉淀下的场景经验也打好了数据基础。另一方面,中国在算法、软硬件、工程等方面的技术优势,也让国产大模型具备了跟住海外领先模型扳手腕的实力。
但随着中美科技博弈迈入深水区,算力仍然是影响国产大模型前进的关键因素,特别在海外谷歌、微软等科技大厂尚在大举搭建算力基建、布局算力投资时,中国大模型的算力国产化已箭在弦上。
刘庆峰也曾表示,在中美AI的激烈博弈下,国产大模型底座下的自主可控的繁荣生态,决定了能在这条路上走多远,也直接影响到国内技术开发者是否能在浪潮中享受更多红利。
这条算力国产化之路,国内大模型企业不得不走,也必须要走,而国产化从算力底座、模型到应用产品,一个也不能少。
这种坚定国产化的认知,浸润在科大讯飞的实践中,早在2019年被列入实体名单时,科大讯飞就已开展国产化移植优化工作,承担国家多个AI国产化攻关项目,走在“为世界提供第二选择”的路上。
实现大模型完全国产化,科大讯飞的路线图也很清晰:自研算力底座、提升基础模型能力、搭建开放生态。
首先,是自研国产化算力底座。联手华为打造出国产万卡算力平台“飞星一号”,无论是讯飞星火,还是星火深度推理模型X1,借助这一国产化算力底座,能实现国产大模型自主可控。同时,讯飞的AI算法优势和华为的硬件能力结合,通过不断地适配和调优,能实现用更少算力,取得更优效果。
去年10月,科大讯飞又宣布联合华为、合肥市大数据资产运营有限公司打造国产超大规模智算平台“飞星二号”,将带来新模型、新算法的持续适配,以及智算集群规模的再次跃迁,为国产智算基建继续储备弹药。
其次,在国产算力底座下,讯飞的基石模型能力也在持续迭代。以讯飞星火4.0 Turbo为例,全面对标OpenAI GPT-4o,在文本生成、语言理解、知识问答、逻辑推理、数学、代码和多模态七大核心能力上再度实现了新升级,且在数学能力、行业知识、图文识别、长文本能力等行业、企业最关注的痛点问题上,底座模型能力也有针对性的提升。
最后,则是通过搭建开放生态,科大讯飞以“通专结合、端云联动、软硬一体”的产品路径,对外输入模型能力,让大模型如“水电煤”一样深入千行百业。
“通专结合”前文已有论述。“端云联动”是指科大讯飞一方面通过云端不同尺寸的通用大模型和星火一体机、“飞星一号”、“飞星二号”算力平台等自主可控的硬件,发挥云端的计算和数据处理能力。另一方面,在端侧可以为不同行业量身定制可以适配不同终端、参数模型更小、效果更优的软硬件一体化方案,为用户提供更好的体验。无论是汽车领域的星火智能座舱,还是教育领域的星火智慧黑板2.0,都是科大讯飞端云协同的实践。
“软硬一体”更好理解。科大讯飞自身在消费电子端布局多年,通过AI学习机、智能办公本等智能终端产品,当这些硬件入口接入星火大模型,具备持续迭代的AI能力,科大讯飞也以软硬一体化为用户提供与时俱进的AI产品体验。
如刘庆峰所言:“国产模型在快速奔跑的过程中,别人用的是最豪华的武器,而我们在一边打仗,一边磨练武器,一边向前进步。在这个过程中,我们需要付出更多的投入,既要挣钱,又要大规模投入,既有软件,又有硬件。”
但从加速推出深度推理模型、重视商业化再到探索大模型国产化的“无人区”,如科大讯飞一样的中国大模型在中美科技博弈中正走出一条自主创新之路。我们也有理由相信,2025年,国产大模型会继续落地千行百业,迎来新突破。
注:文/Judy,文章来源:硅基研究室,本文为作者独立观点,不代表亿邦动力立场。
文章来源:硅基研究室