广告
加载中

云栖大会观察:云计算增长从何而来?

胡镤心 2023/11/02 16:31

文丨胡镤心

【亿邦原创】机器狗在路边到处溜达、各种性能的IDC设备挤成一排、文生3D模型连着3D打印机,正在现场拍照并打印,与会者兴致勃勃地交流大模型的功能和参数,这是10月底的杭州云栖小镇,第14届云栖大会正在这里举行。

大模型是会上当之无愧的主角。

从4月阿里云峰会发布通义千问,到10月底云栖大会发布通义千问2.0、通义千问APP、通义家族八大行业模型,阿里云变阵,展现出全力拥抱大模型的强势姿态。

大模型的热度和难度成正比:它技术门槛高,算力需求大;它训练难度高,工具链复杂;它部署落地慢,需要大量二次创新。阿里云试图让这一切变得更便捷——在云栖大会上,从算力存储到工具链配套到开发者生态,阿里云秀出全栈的产品技术框架,让大模型各环节的从业者都可以从中获益。

01

开放,以及被集成

今年云栖大会的的关键词是“开放”。

阿里云发布了一串眼花缭乱的新产品:通用模型通义千问2.0以及一串行业模型(通义灵码、通义智文、通义听悟、通义星尘、通义点金、通义晓蜜、通义仁心、通义法睿)。这些产品的研发逻辑是什么?阿里云CTO周靖人认为,是“展示”,也是“打样”——不管是通用模型还是行业模型,都不是一个完整应用,需要和企业的业务系统进行融合和二次开发。阿里云希望以产品的形式向开发者展示大模型能够做什么,能够解决什么实际问题,让开发者体会到大模型的能力,激发开发者的想象力,然后将大模型集成到企业的业务系统中。

“开放”背后是一个建构中的正向飞轮。

模型越好用,开发者越多;开发者越多,应用也越多;应用越多意味着算力消耗和算力租用越多,构建这样一个正向飞轮正是开放的根源。

为了更好地“被集成”,阿里云提供了一系列工具链,包括开源了通义千问7B、14B版本,上线了吸引280万名AI开发者的“魔搭社区”,提供了大模型选型、微调工具链平台“百炼”,当然也提供了模型训练平台PAI灵骏和模型推理平台PAI灵积。

值得注意的是最新发布的大模型平台百炼,取义“千锤百炼”。百炼平台可以让开发者在5分钟内开发一款大模型应用,几小时就能“炼”出一个企业专属模型。为此,百炼平台提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,简化了底层算力部署、模型预训练、工具开发等复杂工作。

在“被集成”的过程中,通义家族除了Web端开放,还提供了API和SDK开放。周靖人多次强调,希望大家在自己的业务系统开发中,把通义千问的能力,或者把星尘、点金等行业模型的能力,通过简单的API包装集成在自己的业务体系里来。

为了让“被集成”的速度更快、规模更大,阿里云还在想办法降低AI的使用成本,尤其是降低模型的推理成本,目标是降几个数量级,让更多应用开发用上AI能力。

AI基础设施包括算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,阿里云将整个分布式算力积累、存储网络、弹性计算能力等能力都开放出来。“开发者需要怎样的服务,原则上是各个公司决定的。我们能做的事情,就是让这些模型的服务成本能够更低。”周靖人指出。

据介绍,目前全国80%的科技企业和超过一半的AI大模型公司跑在阿里云上。

02

云计算大变局

阿里云之所以如此积极主动地追求大模型的开源、开放,背后是云计算行业的大变局。

大模型是算力大户。根据券商对创业公司的算力推测,训练千亿参数大模型,如果采用算力租赁,单次训练成本约为百万至千万美元,为了达到理想效果,预计训练至少数十次到近百次,总投入约为近亿美元。训练多模态模型,单次训练算力成本还需再提升数倍至十倍。

同时大模型推理侧的算力需求或为训练侧算力需求的十倍。

从部分创业公司数据可以看到,模型层公司将40%-50%的成本用于购买算力,应用层公司将20%-30%的成本用于购买算力,一个拥有巨大算力需求的应用场景已经出现。

从海外云厂商的2023年Q3财报也可以看出,微软智能云(微软Azure和企业服务业务)Q3营收同比增长19.4%至 243亿美元(超过彭博预期的 236 亿美元),其中,Azure 和其他云服务收入同增29%。在财报后的电话会议中,微软管理层指出,高于预期的AI消费推动了Azure的收入增长。而且,365 Copilot 订阅版将于11 月1 日向企业用户开放,预计将带动相关收入增长。

反之,AWS与谷歌云收入不及预期。谷歌云收入84 亿美元(彭博预期86 亿美元),同比增长22%,为谷歌披露云收入以来最低单季增速。AWS净销售额230.6 亿美元(彭博预期231.3 亿美元),同比增长12%。

AI商业化逐渐兑现,让微软暂时领先。虽然谷歌、Meta、亚马逊并未披露 AI 商业化数字,但谷歌、AWS也在推出托管的大模型云服务Vertex AI 和Bedrock。此外,亚马逊推出五项生成式AI 创新,试图追赶与微软和谷歌等在AIaaS 领域的竞争。

图:三大云厂商收入云收入

国内大模型生态仍处于早期发展阶段,对云计算产业链的驱动较美国稍显滞后。但是随着大模型下游应用逐渐丰富,会带动上游云计算需求增长,有望重构云计算竞争格局。

如何发挥既有优势,同时整合新变量,争取在新一轮周期中扩大云计算份额,这成了阿里云当下的主要目标。

阿里云的优势在于,既有规模庞大的云计算能力,也有一系列前瞻性的AI布局,包括通用大模型和行业模型的研发,也包括整个开源生态的建设。“应该说我们的技术非常全面,布局也非常深远,这也是为什么我们一直坚定不移探索整个产业一系列发展的方式。”周靖人总结。

面对目前国内高性能芯片受限的现状,云计算通过底层的异构能力和并行化能力,通过连接十万、百万的异构芯片,满足算力需求。阿里云副总裁张启指出,“云计算从第一天成立就开始把更便宜、性能更低、数量更庞大的PC机连接起来,让它提供更强的算力,去满足规模更大的计算任务。”早在2003年,飞天5K第一次把5000台服务器连在一起,去实现大型计算量任务。

目前,阿里云已经在全球30个地域建设了89个云计算数据中心,提供3000余个边缘计算节点,充分发挥云计算的低延时、高弹性的优点。“我们的目标是为每一个中国的AI公司提供足够的算力。”周靖人强调。

同时阿里云提供一个完整的产品技术框架。周靖人介绍,阿里云眼花缭乱的产品,其实针对不同的客户群体。

一类客户是模型创业公司和模型研究机构,他们需要强有力的算力和强大的弹性的基础设施,为此阿里云提供先进的AI基础设施。

一类客户是开发者,他们不涉及基础模型研发,而是把模型和业务做结合,在模型上进行二次创新,这也是魔搭社区的重要用户。

开发者也分为两类:一类需要模型微调工具,阿里云提供百炼平台进行定制开发。一类有能力自己做二次开发,能够自己做微调。

“这次AI技术变革,背后是一个技术体系的全面升级。它表面看起来是模型方面的事情,其实是云计算技术的方方面面,甚至可以说是整个计算机科学的全面升级。”周靖人认为。

03

为了无法计算的价值

有意思的是,今年云栖大会采用了2015年的主题“计算,为了无法计算的价值。”云栖大会开始于2009年,至今举办14年,为什么云栖大会格外重视2015年这个时间点?

2015年是阿里云第一个快速增长期。2015 年和 2016 年,阿里云营收连续两年增长超 100%。2015年,阿里巴巴也首次在财报中单列云计算收入。此后,阿里云一路高歌猛进,从2015年的12.71亿元增至2022财年1001.8亿元,7年营收增长了78倍且首次实现全年盈利。

增长来自国内移动互联网创新的喷涌——一大批移动互联网应用基于云计算崛起,阿里云水涨船高。

只不过在移动互联网增速放缓之后,阿里从泛互联网行业转战政企市场,随着腾讯云、华为云、运营商云等竞争对手的崛起,阿里云市场份额一直下滑,2022年国内IaaS公有云市场份额占比32.6%(数据来自IDC)。

2023年,阿里云看到了与2015年如出一辙的市场机会——AI创新如雨后春笋,百川智能CEO王小川在现场表示,“百川成立仅半年便发布了7款大模型,快速迭代背后离不开云计算的支持。”除了百川智能,智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

阿里云希望成为中国大模型的公共AI算力底座。“在这次技术变革发生过程中,阿里云做了最完善的准备,能够为我们所有的开发者提供最强有力的支持。”周靖人强调。

主论坛最后,阿里云还提出更大的开放计划——云上开物,即阿里云将给中国所有大学生每人送一台云服务器,借此培育开发者生态。真实再现了什么叫做“上云要从大学生抓起”。

阿里云想复制2015年的心是如此急切,或许是想实践那句老话——历史不会重复,但会踩着相同的韵脚。

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0