加载中

京东云重塑生产力 CTO们来活了

牛慧 2025/03/01 19:30

2月26日,深圳迎来了今年开年以来,首个大厂的大模型峰会——2025京东云城市大会·深圳站。

这是继DeepSeek在今年春节期间席卷市场之后,各行业人士首次的一个大聚会。现场氛围热烈,后排都站满了人。人们期望相互交流,在DeepSeek上,大家都采取了怎样的行动?进展如何?效果又怎样?当人工智能从"工具助手"向"生产力引擎"进化中,企业和个人将以怎样的方式应对?

而这次大会的主题是“重塑生产力”。这背后或将是正在开启的智能生产力全面迸发的时代序幕。

01

“我们的节奏全变了”

“对我和我们数字化中心来讲,今年初DeepSeek发布以来,我们重新调整了所有的工作节奏。”圣象集团数字化中心总经理沈晓明在大会上坦言。之前公司已有一些人工智能应用,现在正尝试用DeepSeek重新做一遍。在大会之前,沈晓明拿到了一些最新数据。“整体上有一个很大的提升,包括准确率。”他预计,将来企业可以有更多的应用,使用人工智能来完成。

“春节期间,我们最忙的一件事,是安抚客户的焦虑。”悠易科技首席运营官蔡芳说,这是一家做大数据和AI营销的企业。“春节后,所有人都跑过来问我们,老板让我们用AI,我到底怎么用?用在什么场景?用了之后我们团队的人会不会被砍掉?”蔡芳说,营销是AI非常好的落地场景,以前由于技术的局限,大家只在局部用,而这次AI给全行业带来了一个很大的机遇,他们也在忙着全面拥抱AI,迭代自己的产品。

其实,今年春节后,几乎所有行业的工作节奏都被改变了。节前制定的工作计划,有很大一部分被推翻。而如何将DeepSeek人工智能技术与自身业务结合,变成当下一件极为紧迫的事。

在央国企市场,2月19日,国资委召开中央企业“AI+”专项行动深化部署会。根据爱分析披露的数据,截至2月21日,已有45%的央企完成了DeepSeek模型的部署,包括了“三桶油”——中国石油、中国石化和中国海油,以及国家电网和南方电网。这一速度在过去难以想象。

在政务市场,很多省市政府部门,春节期间马不停蹄。春节开工首日,深圳龙岗区已宣布上线34个DeepSeek政务AI应用。几乎在同一时间点,江西赣州、江苏无锡、新疆乌鲁木齐、河南鹤壁纷纷完成DeepSeek部署,展开政务应用。一些地方首批“AI公务员”上岗。

在金融领域,工行、建行、邮储、招行等都已部署了DeepSeek,应用场景从知识助手类向更深的理财、风控等延伸。“DeepSeek的出现,让私有化部署效率提升,精调、微调的数据量需求降低了一个量级,CoT慢思考思维链特别有助于Agent应用。”华夏银行科技部副总经理、大数据技术中心总经理王彦博在大会上介绍,目前他们已部署了DeepSeek,下一步将考虑建设综合各类大模型的智能平台,并推进和京东云DeepSeek一体机合作,用这种精炼的方式,实现大模型的深度应用。


“有数据统计,现在全国有2.5亿人用过大模型,相当于每6个人中就有1个,而且这个速度还在加速扩张。它为什么这么热?”京东集团技术委员会主席、京东云事业部总裁曹鹏说,DeepSeek这一轮有两个重要特性,一是它大大降低了模型训练和推理相关的成本;另一是它对异构算力的兼容性非常好,这给AI后续的普及带来了很好的基础,所以现在全国上上下下、各行各业都投身到这波大模型的热潮里。

“我们发现,这一轮一些企业是真正花钱来做大模型的事。”一位行业应用人士告诉数智前线,“企业的目标是未来三年,借助AI构建出的竞争优势,成为行业头部,或维护自己的行业头部地位。因此,这轮他们如果能早半年推出,竞争优势完全不同。”

“DeepSeek-R1这类推理模型,相当于变成一个理科生,提供了数字运算和分析能力,让全场决策或者全局大脑成为可能,这是它最大的价值。”一位工业AI人士称,他们正在为一个项目赶工,目标是用一套工厂的管理班子,借助AI的全局决策,从管理一家企业到管理五家。“一旦实现,它的竞争力在行业里是没有人能匹敌的。”

“我们接触了很多客户,看到大家处于大模型的四个应用阶段。”曹鹏说,最开始是建立了解,去使用大模型的基本功能。之后开始一些轻量级应用,比如知识库、合同审核、助手、文档摘要。但用着用着会发现,通用模型可能不那么理想,因为企业有自己专门的场景、专业的数据。于是大家进入第三阶段,用自己的数据做模型蒸馏,训练专用的垂类模型。而随着模型能力的增强和智能体的增加,就会产生协同和新的业态,最终走向第四阶段——场景的全面智能化。

02

技术变革浪潮下,要饱和式投入

大会上,行业人士也谈到了当下大模型落地的几大挑战,这在目前人们积极拥抱大模型的形势下,显得尤为突出。

数据是我们遇到的非常大的挑战。”悠易科技蔡芳说,尤其在做消费者旅程管理,这些数据散落在各个平台如小红书、抖音、京东、天猫以及企业自身。怎么能把这些数据统一在一起,作为模型很好的输入?“我们几年前开始跟不同数据主体,探讨用联邦模型或隐私计算方式,让数据可用不可看的方式,解决连通问题。”她认为,伴随AI的深入应用,企业的心态会更开放。

“我们目前碰到的一个最大的瓶颈也在数据方面,因为我们有25年的数据积累。”圣象沈晓明说,这些数据五花八门,甚至包含了木材供应商的季节性交付周期。这些数据的收集、清洗、对模型的输入训练,带来了效率和投入问题。沈晓明认为,他们未来的工作重点将是解决数据问题。他们甚至有一个设想,在进行大模型训练、形成生产力之前,先训练一个数据清洗的模型,作为一个应用场景来落地。

除了数据,算力依然存在缺口。虽然DeepSeek蒸馏版的7b、14b模型,对算力要求大幅降低,但在很多对性能严苛的场景下,企业需要部署6710亿参数的满血版DeepSeek-R1。“这样,算力需求与之前的开源模型相比并不低。”一位AI应用人士说。

而大模型在政企市场的落地门槛很高。中兴通讯股份有限公司副总裁王健雄在会上提到,大模型在蒸馏、集成、软件生态和运维保障等方面都存在挑战。

部署满血版模型、结合场景展开应用开发,都需要专业团队。“去年,行业落地的热点是长文档、做RAG。今年,场景里RAG该做还得做。而且,由于DeepSeek-R1有了理科生的能力,大家更倾向于推理应用的落地,都在探索将推理能力蒸馏到一个小模型里。”一位服务商说,现在成了RAG+蒸馏+Agent三管齐下。

“人工智能真的不光只是个模型,有很多模型管理能力在冰山之下。”中集集团CIO潘进杰以数字人为例进一步解释,他们训练维修助手时,并不是一帆风顺的。就像员工入职后有一个逐步成长的过程,数字员工也一样,也需要有manager来管理。从去年7月到12月,维修助手经过持续训练,准确率从84%优化到98%,并在持续优化中。“未来我们IT人要把我们数字员工管理好。”

京东科技人工智能业务总裁、京东探索研究院院长何晓冬谈到,目前他们与行业面临的共性挑战是人工智能价值的最大化。如何把大模型落到真正的应用场景,并且能打穿,非常关键。因为往往一个业务有很多环节,如果仅仅把一个环节提效50%,10个环节之后,提效可能只剩下5%。他期望更多的变革,“甚至是不是可以重构甚至取消某些环节,最终给客户看到真正的价值”。

“长期看,我们对于AI的认知还需要放大格局。”何晓冬进一步说,现在大家可能还纠结投入产出,但AI是历史性的趋势。光伏、新能源这些中国做得非常好的行业,在基建上都经历了饱和式投入,才打开一个新天地,“我相信AI也有这样的机会。”

03

AI普惠的“四阶方案”

面对来自四面八方企业的需求和落地挑战,京东云相关人士告诉数智前线,京东云在大年初一,全面启动围绕DeepSeek落地的支撑工作。2月13日宣布全面上线DeepSeek产品。

从这次峰会公布的信息来看,京东云为大模型应用处于四个不同阶段的企业都匹配了相应服务,并特别结合了DeepSeek推出相关方案,通过整合“全栈式AI产品矩阵”和“场景化解决方案”,加入到这场AI普惠的进程中来。

首先是提供五种模式,满足政企市场火速上线DeepSeek的需求。


曹鹏介绍,对于初创企业和开发者,提供裸金属智算服务和公有云Token调用两种服务。而且,预装轻量级DeepSeek-R1模型的裸金属服务,价格低至1.89元/小时。针对大中企业,尤其是要求“数据不出域”的金融、政府、企业等用户,提供大模型私有化部署,包括一体机、纯软件部署和算力运营三种模式

DeepSeek一体机是目前火爆的产品。此前,京东云DeepSeek一体机产品一经公布,已有非常多客户来接洽询单。京东云提供了从轻量版到满血版产品,DeepSeek满血版可以跑在单台服务器上

京东云也帮助企业政府部门做了本地基础设施的智能化改造,如河南鹤壁依托京东云(中原)算力中心的vGPU算力平台,在本地部署了DeepSeek,既满足政府需求,也能服务当地企业。

其次是智能体开发平台,让企业快速搭建智能体。

“如果说大模型是一个可以思考的大脑,那么智能体就是它的手和脚。”曹鹏说。随着DeepSeek全面接入,智能体成为大模型产业落地的核心载体,应用形态正从"工具助手"向"生产力引擎"进化。

京东提供了言犀智能体开发平台,接入了包括DeepSeek的数十个大模型,提供插件、工作流和工具。同时,将沉淀下来的高频次场景,预制了模板,如办公Agent、营销Agent、服务Agent、数据Agent以及助手Agent等。


伴随DeepSeek-R1这类推理模型性能的提升,Agent将越来越深在京东场景应用,京东云智能编程助手JoyCoder,代码采纳率超过40%;数据分析助手言犀ChatBI,已达到中级数据分析师的水平,能处理相对复杂逻辑下的数据,生成智能报表。京东上周刚刚发布的一款协同办公产品京me Max,已在京东集团使用。

味全食品、中国飞机租赁、融谷信息等都采用言犀智能体开发平台,开发了自身的智能体应用。

第三是模型蒸馏,通常两周形成企业专属模型。

当场景越来越深,通用模型效果已达不到要求,企业要用自有数据对模型再加工。京东零售、金融、物流、健康都蒸馏出自身的垂类模型。采用言犀AI开发计算平台的模型蒸馏,通常两周可以拿到一个企业专属的大模型

曹鹏介绍,京东云的模型蒸馏、数据治理等核心技术,被Nature杂志收录,这也是这一领域唯一被Nature收录的云厂商。

“有了专属大模型,我们的经验是,整个AI应用就会快速爆发出来。”曹鹏说。

此前,京东基于垂域模型开发应用,已经获得成效。如营销上,京东APP已不是千人千面,而是千人千模,背后是营销大模型的支撑,让APP商品页面布局、营销文案更具个性化,京东还在进一步探索中。京东的金融增长云,背后是用四五亿运营用户的知识训练的垂类模型,目前国有四大行中的三家使用了该服务,客户转化率将近80%。

而这是上层应用和服务的坚实支撑,离不开底层技术,这是京东云背后的力量,用极致性价比来推动AI普惠。这些技术包含超智算一体化算力集群、云海AI存储、高性能云网络、vGPU AI算力平台、阿尔法智能算力模块、京东云大模型安全可信平台等。

在这方面也有诸多案例,如京东云支持某新能源汽车头部厂商,打造覆盖全集团的智算底座,实现千卡级AI算力集群的精细化管理。目前,该平台已支撑了企业智驾、人形机器人研发等20余个核心场景。

当下正是行业重要的转折点。DeepSeek的开源,一下子引爆了整体行业的激情,目前各方玩家都以极大的热情,投入到AI普惠化的进程中。仅仅过去一个月,很多生态应用已经涌现。可以预见,未来AI应用将快速走入千行白业,全面实现生产力重塑。

文章来源:数智前线

微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭