【亿邦原创】“地表最强中文大模型。”
“中国最受欢迎的大模型。”
“开源领域最强大模型。”
……
在5月9日阿里云AI智领者峰会,阿里云CTO周靖人数次这样形容通义大模型。
这些形容词这背后是通义大模型发布一年来的成绩单:在产品上,通义千问从1.0版本升级到2.5版本,刚发布的通义千问2.5,号称性能全面赶超GPT-4 Turbo。在商业化上,通义大模型通过阿里云服务企业超9万,通过钉钉服务企业超过220家。在生态上,通义开源模型HuggingFace、魔搭ModelScope等社区的累计下载量突破700万。
过去一年,大模型是科技领域最热闹的行业,模型层“卷生卷死”,应用层“盲人摸象”,生态层还在就开源与闭源“打嘴仗”。作为大模型最重要的参与者,阿里云在研发与实践中找到哪些应用突破?看到哪些行业趋势?又进行了怎样的战略布?我们从阿里云AI智领者峰会上一窥究竟。
1、通义千问发布一周年,阿里云交出AI成绩单
从整个峰会来看,阿里云的焦点是:升级、开源、应用。
模型升级最受瞩目。2024年上半年,整个大模型行业的主题默认是追赶GPT-4,追不上则从全球大模型第一梯队掉队。
本次阿里云发布的通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。这是周靖人说出“地表最强中文大模型”的底气。
同时,通义大模型还在不断开源各个规模的基础模型。
2023年8月,通义大模型宣布加入开源行列,随之沿着“全模态、全尺寸”路线,陆续推出十多款模型。其中较为瞩目的是参数规模横跨5亿到1100亿的八款大语言模型。
小尺寸开源模型:0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;
中等尺寸开源模型:32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。
大尺寸模型:如72B、110B能支持企业级和科研级的应用。
其他:视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。
目前,通义开源模型系列下载量已经超过700万。
在开源之余,阿里云还升级了AI Infra平台——百炼,推出了百炼2.0,服务开发者。
百炼集成了包括开源和闭源在内的上百款大模型API,同时联动魔搭开源社区,支持企业上架通用或行业模型,给开发者提供足够多的模型选择。同时,百炼依托阿里云AI基础设施,支持千亿级模型的万级并发推理需求。
周靖人表示,阿里云是全球唯一持续开发模型、坚持开源的公司。
2、AI倒逼云计算
云计算在满足大模型发展的各种苛刻需求,大模型也在倒逼云计算玩命升级。
阿里云公共云事业部总裁刘伟光表示,“云计算”诞生于2006年,由谷歌提出,那时的云计算特指通过IaaS、PaaS、SaaS架构对企业IT能力的升级。
2014年,“云原生”概念提出,聚焦企业的软件开发架构,尚未对标企业的完整IT架构。随后,随着容器化技术、微服务架构等相继产生,云让整个IT产业有了巨大升级空间。
现在,云计算的IaaS已经延伸到了芯片、指令集、异构算力层面,底层是全球一张网,全球数据中心的管理和调度;SaaS层发展出MaaS,甚至Token as Service等新模式,带来云计算网络、存储、架构、芯片的巨大变化。因为AI需要云更加智能化地调度整个内核、智能检测所有故障、自适应业务发展、自动配置性能、智能分析数据,包括让企业用云变得更简单。
“从去年到今年,云计算下一步的发展,不仅仅是在云上开发一个大模型,而是大模型倒逼着云计算往前走,比如阿里云在向量存储、检索服务、存储加速、容器化集群、CPUGPU混合、高速网络等方面的不断投入。”刘伟光认为。
3、公共云正在成为企业标配
在应用方面,阿里云没有走单点突破路线,而是以极高投入,覆盖涉猎的所有重要行业与场景。
5月9日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。
中国一汽基于阿里云通义千问打造的大模型应用GPT-BI已实现在财务、质保等领域的智能报表生成,并覆盖中国一汽研产供销等9大领域决策场景。在报表生成时长上实现5秒快速生成多变量报表,在模型准确率方面达92.5%,这意味着GPT-BI在研产供销多种场景上都具有优秀的预测能力和泛化性能。
微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。
同时,全球多地多活、离线在线混布、单元化部署、容器化部署的公共云,正在成为中国企业出海的标配。
一方面,在当前阶段,AI技术栈还未收敛,很难确定最终哪个场景得以突围。另一方面,阿里云有足够能力与资源覆盖全场景的各种需求。
刘伟光认为,对企业来说,上云的好处:
第一,提升IT资源利用率。
第二,改变采购模式。从重资源投入改成租赁模式,可以大幅降低IT支出。
第三,节省时间成本。在新国家开展新业务,部署一个数据中心要以年为单位,换做公共云租赁,则以天为单位完成部署。
同时,云正在成为社会创新的孵化器。无论是电商、支付、制造业、快递、出行等应用,都离不开云和大数据支撑。今天有一个非常确定的共识是:随着大语言模型与云的结合,未来绝大多数新技术会率先甚至只能诞生在云上。
在场景上不遗漏一丝可能,在生态上广泛布局,在模型上大力出奇迹。通义千问发布一周年,阿里云在AI时代的硬仗才刚刚起步。
文章来源:亿邦动力