广告
加载中

京东曹鹏:供应链 产业链上的大模型更有价值

亿邦动力 2023/07/14 11:51

【亿邦原创】7月14日消息,在昨日召开的2023京东全球科技探索者大会暨京东云峰会上,京东集团技术委员会主席、京东云事业部总裁曹鹏发表了题为《突破供应链价值,跨越产业智能》的演讲。他指出,在京东的技术探索中,人工智能与产业的结合一直是重点。京东言犀大模型是为产业应用而训练的,具有更高的产业属性、更强的泛化能力和更多的安全保障。

曹鹏介绍了京东言犀大模型的三大典型特征:更高产业属性、更强泛化能力和更多安全保障。京东言犀大模型在训练时使用了京东各种场景积累的优质数据,并且依托京东云完善的安全体系,保证了客户的数据和业务系统的安全稳定。

为了更好满足用户需求,京东还推出了言犀AI开发计算平台,提供了丰富的行业知识库、开放性以及训练和推理优化工具等功能,让用户能够快速将通用模型转化为适合自身场景的专业模型。

京东云还通过优加AIGC内容营销平台,利用大模型帮助商家自动生成营销素材,从而提升了商家的营销工作效率。

为了支持大模型的发展,京东还自主研发了一系列基座产品,如向量数据库、云舰3.0、云海2.0以及京刚3.0。

最后,曹鹏表示京东一直坚持源于产业、服务产业的发展理念,他们希望通过技术升级,让供应链运营更高效,让整个产业更智能。

以下为演讲实录:

尊敬的张院士、各位合作伙伴和媒体朋友,大家上午好。我是京东的曹鹏。

近几个月,一直有人问我,京东怎么还不发大模型。其实,不是不发。京东21年就构建了天琴超算集群开始训练大模型。22年到百亿级,今年已经是千亿级模型,并且在世界大赛中取得了非常不错的成绩。只是我们认为,对话类的通用大模型不应该是全部。虽然现在这类产品很热,但大模型不应该只是拿来聊天、写诗、作画的玩具。

人工智能与产业的结合一直是京东技术探索的重点。在零售场景,京东超过85%的商品采购由机器自动完成。在物流场景,亚洲一号里的拣货员与“地狼”机器人配合默契,大幅提升拣货效率。在服务场景,京东智能客服可以自动化应答90%的服务咨询。作为一家新型实体企业,我们思考更多的是大模型如何与实体结合。今天和大家分享一些我们的探索。

供应链产业链上的大模型更有价值,因为供应链的链条越长,带来的数据相关性更高。相关性高的训练数据越多,模型越大,才越有可能产生产业端的智能涌现。同时这些模型更切实地解决实际场景中的问题,带来更好的经济和社会价值,也有助于模型获取更多的资源持续发展。

京东拥有丰富的供应链场景。京东的大模型一直在自有的零售、物流、健康、金融等场景中打磨。基于此,我们研发了京东面向产业的大模型——言犀。

“言之有物,心有灵犀”,这是我们赋予言犀大模型的内涵。经过京东复杂场景历练,言犀会更加懂产业需求。言犀具备三大典型特征:更高产业属性、更强泛化能力和更多安全保障。

首先,言犀在训练时除了使用通用语料数据之外,还大量使用了京东各种场景积累的优质数据。可以说天然具有产业基因,能够更好地适配实体场景,解决真实的产业问题。

其次,我们是为了产业应用而训练的大模型,本身就具备行业泛化能力。通过小样本数据+模型精调,即可达到匹配产业需求的效果。

第三,依托京东云完善的安全体系,可以有效保障客户云上云下整体资产应用,以及业务系统安全稳定,让客户可以放心使用大模型服务。

当然,一个模型没法直接满足所有的场景需求。工欲善其事必先利其器。今天我们也把开发大模型的底层能力解耦出来,推出了言犀AI开发计算平台,可以为客户的大模型开发和行业应用,提供定制化的解决方案。

这个平台的第一个特点,就是具备丰富的行业知识库。京东在零售、物流、健康、金融等行业多年积累的知识都沉淀在平台上。

第二个特点是开放,平台不仅提供京东自研的言犀大模型,也支持行业各类开源通用模型。

第三个特点是精选了京东技术团队多年来开发出的100多种训练和推理优化工具,可提供更高效的大模型开发环境,让用户可以快速把一个通用模型,转化成适合自身场景的专业模型。

通过言犀平台,不到一周时间,即可完成从数据准备、模型训练到模型部署的全流程。之前需要10余人的科学家团队工作,现在只需要1-2个算法人员。通过平台模型加速工具优化,节约90%的推理成本。

这个平台将于8月上线,欢迎有需要的用户预约注册试用。

下面请我的同事为大家演示一下,如何基于言犀AI开发计算平台,将通用大模型训练成专业的健康行业大模型。

谢谢。刚才大家看到的是京东健康团队,在辅助问诊这一个小切面上的探索。而大模型为健康产业带来的想象力是宏大的。

比如说,大模型的多轮交互、工具调用、总结摘要、图文多模态等能力,能够助力医疗健康多场景的应用升级:有服务用户的个人健康助手、随访管理;还有服务医生、药师的诊疗助手、医疗文案书写、科研助理、诊疗服务调度等。

除了创新服务体验,人工智能的一个重要作用就是持续优化成本提升效率,非常典型的场景就是物流。

京东的物流服务通过合理规划仓网布局,把商品提前放在离消费者最近的仓库,缩减搬运距离和搬运次数,从而实现更高效的履约。

下面我们先通过一支视频,看一下过去十年来,我们在智能物流园区场景下的探索。

以前的物流网络建设更多是基于物理世界的不断测试和优化。但随着技术的发展,利用数字孪生,实现高效低成本的智能预测。

基于大模型,京东物流发布了“京东物流超脑”。针对供应链全链路,提供辅助决策、运营优化,以及一线作业智能助手等能力,实现降本增效。

这支视频展现的就是仓内智能交互建模,以及对仓库布局问题的智能化原因分析。例如我们输入,请分析在今年双11大促的布局堵点。系统经过分析,会回答,效率堵点为地狼货架数目不够,建议增加一排货架。这极大地减少了传统方法花在调研、分析、测试上的成本。

接下来讲一下大模型对于效率的提升,我们以营销场景为例。

在电商营销场景,京东云优加AIGC内容营销平台可以更好地理解商品特征,从而帮助商家自动生成商品文本、图片等营销素材,极大地提升商家营销工作效率。

下面我们播放一段视频,看大模型如何提升营销效率。

这段视频展现了在电商营销场景下,通过一个商品的图片,可以快速生成需要的商品图片等,满足快速开店的需求,成本降低90%以上,周期从7天缩短到半天。

另外,在金融营销场景,我们也沉淀了海量的专业知识,通过大模型来优化营销运营流程,降低运营人员的学习成本与操作成本。下面请我的同事为大家现场演示京东金融是如何基于大模型,实现营销运营效率的大幅提升。

零售是京东最核心的场景,也是供应链最丰富、最具想象力的场景。大模型将会把用户体验带到一个新层次,包括所有用户交互会变得更加便利、更智能。

同时,大模型也会从多个方面给予商家能力提升,让商家的经营决策变得更高效。

大模型时代也在考验着技术的基本功。想做好大模型,没有扎实的技术底座不可能实现。

向量数据库是支撑大模型的重要产品,京东从2019年开始自主研发,历经电商大促场景磨练,可用性达到99.99%。现在,我们的向量数据库实现了平稳支撑百亿级向量数据检索。

将京东向量数据库用于大模型预训练,相比传统方式,推理成本降低80%。

此外,我们也积极助力开源生态建设,Vearch已捐给开放原子基金会,助力国产生态发展。

另外,我们的一系列基座产品也针对大模型训练场景进行了专门优化。

比如我们全新的云舰3.0,通过创新的异构计算池化技术,实现GPU/NPU资源成本下降50%。此外,云舰3.0全面支持多云多芯多活,助力企业渐进式完成国产化替代,实现真替真用。

我们的高性能存储平台云海2.0,单集群每秒读写性能提升5倍,达到行业领先的千万级iops,同时延迟时间降低50%至百微秒。结合存算分离技术,将成本降低30%。

我们自主研发的软硬一体虚拟化引擎——京刚3.0,网络性能提升高达4倍,支持100Gb VPC网络,云硬盘单实例性能突破百万IOPS,更好支撑大模型训练。

今年是京东集团创业二十周年。京东成长为一家为社会贡献价值的新型实体企业,是受益于时代,也源自于一路相伴的用户、合作伙伴。我们的技术发展,也一直坚持源于产业,服务产业。我们希望通过技术发展和升级,让供应链运转更高效,也让整个产业更智能。

产业智能时代的到来,依赖于整个行业的努力。“孤举者难起,众行者易趋。”京东永远坚持开放的理念,愿和产学研各界的有志之士一起,共同探索产业智能时代的无穷魅力!

谢谢大家!

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0