【亿邦原创】制造业是大模型应用的主战场。
只不过制造业技术门槛高、使用场景碎片、安全要求高、数据量少,而大模型则工具链复杂、训练难度高、部署落地慢,还需要大量二次创新。这两个技术门槛同样高且复杂的行业,如何进行深度融合?
在过去一年里,中国一汽以BI产品作为大模型应用的突破口,形成自己的大模型架构:微调大模型+NLP小模型+RAG检索增强,同时还设计了基于钉钉的用户提问+大模型推理生成+数据中台事故查询+钉钉端可视分析这样一个端到端链路。
中国一汽体系数字化部数据创新与试验部总监蒋汉卿指出,在以算力、算法、数据三要素为核心的大模型时代,传统企业要拥抱大模型,数据能力是企业的核心竞争力。制造业可以跟互联网大厂在模型层面和算法层面进行合作共建,但是对于场景的深入洞察和理解,以及基于场景生成的数据工程能力,必须长在自己身上。
中国一汽通过与阿里云的合作,推出大模型产品GPT-BI,同时基于通用大模型能力,依托中国一汽的云原生技术架构及数据底座,沉淀高质量的训练数据集,研发一汽自主可控的汽车行业大模型,重点突破大模型在产品研发、生产制造、营销服务、经营管控及代码开发的深度应用,不断提升企业的运营效能和产品竞争力。
在5月9日阿里云AI峰会上,中国一汽体系数字化部数据创新与试验部总监蒋汉卿蒋汉卿,分享了中国一汽的大模型规划与探索。
以下是演讲内容,亿邦动力编辑,未经嘉宾审核。
大家好,我是来自中国一汽体系部的讲汉卿,我今天的分享主题是《AI驱动业务转型换新》,也借此在场景下向大家报告一下,中国一汽是如何进行大模型的实践探索的?
1、大模型应用的突破口
首先大家观看一分钟的短片。
【短片】:欢迎使用中国一汽GPT-BI,您可以通过提问方式获取数据结果及图表,实现问答及洞察。当前GPT-BI覆盖企业研产供销等9大领域指标的查询与分析,GPT-BI包含数据指标实时查询、管理层决策辅助、业务人员高效数据分析三大场景,满足每个角色的数据使用需求。
比如董事长前往广东省进行实地调研,以往需要花费7天进行数据报告的开发,现在通过语音就能调取23年至今每个月广东省的AAK完成情况,帮助董事长在调研途中高效了解任何维度数据,精准把握市场脉搏。
又如,集团领导在听取营销领域汇报时,发现部分车系销量未达标,点击红灯项跳转至GPT-BI,一键生成营销分析报告。GPT-BI构建智能分析思维链,让决策变为选择,带来基于全量数据的实时决策革命,跨越了数据价值实现的最后一公里。【短片结束】
短片里介绍的就是我们中国一汽首款大模型落地应用GPT-BI。因为时间关系,当时做这个短片的时候,都是基于真实场景的一个录屏,所以其中生成的数据都是企业的真实数据,所以我们统一做了一个模糊处理。
在这个短片中大家可以看到,GPT-BI切实解决了我们企业在日常经营管理过程中经常面临的三类问题。
第一,解决了在不同场景下,随时随地的实施数据查询。
我们日常沉淀了很多报告,不管是分场景和分领域的日报、周报、月报,或者是生产领域、研发领域、销售领域的报告,甚至是基于某个会议场景下的报告,这些报告很难满足管理者在全场景下对数据的实时查询需求。
这时我们基于GPT-BI,基于我们企业全量指标,进行预训练,然后我们用NLP技术,自动生成语句,经过5秒时间生成一个数据结果,实时满足不同场景下、不同层级人员对数据实时查询的需求。
第二,真正实现智能决策辅助。
中国一汽在顶层会议的场景下,已经全面取消了PPT汇报,各个领域的汇报都是基于大屏,也就是BI报告的广泛应用,报告里的指标已经进行了直接直采,数据清洁可信,让我们智能决策变成可能。
我们将GPT-BI的大模型能力引擎放在各领域报道的后面,将报告里的指标AI化,这样管理者点击相关的指标,就会跳转到GPT-BI,然后生成智能思维链,自动生成分析报告,相当于辅助管理者去找到问题的根因。
这样就会优化或者杜绝管理者基于个人经验与理解,在多个BI报告里、多个领域交叉、层层下转的这种分析决策模式,相当真正实现了智能决策。
第三,让人人都能成为数据分析师。
中国一汽经过两年数字化转型,通过对业务人员的培训和实战,不断提升全员的数智能力,涌现出一大批低代码工具和自助分析工具的专家。
尽管如此,依然存在不少业务人员还是处于数字化初级水平,在做数据分析的时候,更多依赖于IT专家。
GPT-BI完美的解决了这个问题,它不仅可以通过语音输入自动生成结果,而且可以通过思维链的加持,自动匹配你要分析图形。
比如,你要去现状和目标的差距,它会自动给你匹配征管图;我要关注数据的占比情况,它就会自动给你匹配环形图;他要关注数据的变化趋势,它会自动去匹配折线图,这就大大降低了数据消费的门槛,让数据驱动业务成为了可能,让人人都成为数据分析师。
从去年9月份至今,GPT-BI已经成功应用于我们很多经营决策场景,逐渐成为各层级各角色的一个智能辅助助手。
2、如何训练GPT-BI?
回看过去,GPT-BI的成功不是一蹴而就,这个过程中我们也面临很多困难。
比如我们看这张模型准确率的趋势图,我们一上手的时候,准确率只有20%,今天已经达到了92.5%的准确率,其实这张图也是我们这段艰苦历程的一个缩影。
我们在选择基础模型的时候,综合考虑了大模型的推理能力和生成速度,我们选择了阿里通义14b,并没有选择参数更大的72b。
在企业应用场景,我们不允许大模型一本正经的胡说八道。为了杜绝大模型幻觉,我们开发和训练了NLP基础模型的小模型,为了弥补大模型缺乏企业专业数据这一先天不足,我们外挂了知识向量库。
但是这一调整到一定准确率后无法继续提升,我们又果断进行了全参数的微调。
最终,我们形成了微调大模型+NLP小模型+RAG检索增强的Agent架构。
同时我们也设计了基于钉钉的用户提问+大模型推理生成+数据中台事故查询+钉钉端可视分析这样一个端到端链路。
这里也特别感谢阿里云给我们的伴随和支撑。我们率先体验了百炼平台1.0,阿里云也提供了很多的高阶算法专家给我们提供支撑。
一款优秀的产品不仅仅是性能优秀,更是用户对产品的粘性和认可,这就离不开产品运营,离不开持续不断地提升客户体验。
因此我们在大模型上线过程中,构建了一个问题的反馈机制,用户每次根据大模型回答的表现,都可以进行点赞和点踩,也可以通过语音和文字,直接输入反馈的问题和对功能改善的提出。
同时我们也不断优化了bad case的解决机制。
上线初期,我们一个bad case的解决,需要2~3周时间,到现在,我们解决问题最长不会超过48小时。
在这个产品上线初期,我们不支持语音功能输入,因为在语义转化过程中,如果提问者的问题过长,语音转语义会占用1~2秒时间,并且由于方言或者吐字不清,会降低大模型的准确度。
但是客户对语音诉求越爱越多,我们还是主动迎接这个挑战。
我们并没有去选择去优化这种语音转语义模型,而是将我们自己的行业大模型进行不断优化和训练。
在产品运营过程中,我们认为对GPT-BI的提问是可以穷尽的,所以我们将错误的语义转化进行适配,让它去映射、生成正确的结果,从而去提高语音识别准确率。
实际上通过我们的不断试错和解决,以及不断的创新和探索,我们整个团队的能力和认知也得到了快速提升。
在这个过程中,我们构建了GPT-BI这个大模型应用,我们还构建了中国一汽大模型落地的24步方法。
我们也提出了一个核心观点,在大模型时代,我们可以跟互联网大厂在模型层面和算法层面进行合作共建,但是对于场景的深入洞察和理解,以及基于场景生成的数据工程能力,必须要长在自己身上。
也就是说在以算力、算法、数据三要素为核心的大模型时代,传统企业要拥抱大模型,数据能力将是企业的核心竞争力。
后续我们在数据实时展示,数据的轻度智能分析的基础上,我们后续将会以GPT-BI沉淀的大模型为雏形,通过不断投喂企业内外部数据与知识,去打造中国一汽的智能分析大模型,在数据可视的基础上,进一步实现根因诊断、预测分析、方案辅助生成这样的能力。
3、中国一汽的数字化战略
讲到这里大家不禁好奇,我们的这个方案很复杂,需要大模型,又需要小模型,又需要RAG,又需要全参数的微调,我们覆盖的经营决策场景这么广,我们需要的数据量级以及数据准确性这么高,我们为什么选择GPT-BI作为中国一起大模型实践从0-1的突破点。
这里我就不得不去介绍一下中国一汽的数字化转型。在2020年初,中国一汽提出了1164数字化转型战法,
第一个“1”是百分百的业务孪生和百分百的效能翻倍。第二个“1”是一个载体,就是我们Dios一汽云工作台。
为了让我们的业务能实现数字孪生,也就是全量业务在线,我们将传统的L5级流程架构,基于云原生进行解耦,首创“业务单元”这个概念,并且定义了它的输入、输出、执行决策、执行标准等39项能力要素,然后整合人与业务,以业务单元为主体,按角色分工分配工作任务,让每个人知道在什么时间干什么事,什么事达到什么标准,交付什么内容。
也就是说,通过业务单元,我们将这个物理世界与真实世界进行连接,实现真正的业务数智孪生。
当全量业务在线以后,就会产生大量高质量的业务数据。
这个时候我们同步发布了《数据基本法》,我们明确了信息架构的管理原则,数据产生的管理原则,以及数据应用的管理原则。
我们以需求拉动、指标治理为抓手,进行指标数据治理,将全量指标进行系统的直连直采,同时我们沉淀了研产供销全领域的高价值的数据资产,也就是说,业务的在线让我们企业产生了源源不断的高质量的业务数据,伴随着数据治理,沉淀清洁可信的海量的数据资产,这也就为我们打造GPT-BI带来的前提。
GPT-BI的落地应用,让我们真切地感受到了大模型为企业带来的价值。
今年1月,中国一汽全年工作部署会上,董事长发布了要实施AI+创新工程。基于通用的技术大模型,依托中国一汽的云原生技术架构及数据底座,沉淀高质量的训练数据集,研发一汽自主可控的汽车行业大模型,重点突破大模型在产品研发、生产制造、营销服务、经营管控及代码开发的深度应用,不断提升企业的运营效能和产品竞争力。
当前我们九大业务IT一体化,已经识别了12个高价值业务场景,并且已经纳入月度考核,进行赛马机制,并且在年底也会进行成效大比武。
当前除了GPT-BI首期上线以外,我们的GPT营销助手,GPT-AI智慧助手,代码生成辅助已经进入PUC验证阶段,也简要为大家报告一下。
第一个应用是销售顾问助手。
4S店是连接消费者与主机厂的核心枢纽,销售顾问在接待过程中一个表现,将很大程度影响消费者的购买意愿,也就是说,持续不断的提升销售顾问的能力,是主机厂一直追求的目标,但现实情况却不尽如人意。
一是为了应对不断变化的市场需求,新产品和新技术不断涌现,产生海量知识,量大且复杂,你很难通过培训让销售顾问快速掌握这种企业的核心知识。
再一个销售顾问群体,流动性比较大,新入职的销售顾问也很难在短时间去达达达到厂家要求的能力极限。也就是通过一项数据表明,80%的客户认为,在销售顾问接待的过程中,他的专业能力的表现不尽如人意。
因此我们通过这种数数分类定标准的方法,将100余名金牌销售顾问的20余万条的销售数据,进行萃取,萃取成5大类200多个能力指向。
同时我们不断沉淀和提炼企业产品的销售位点、销售政策以及售后服务的海量知识数据,共同去构建这种知识向量库,然后通过大模型去构建我们GPT销售助手,这样就会实时辅助提升销售顾问在接待方面的专业表现,然后去提升整个销售顾问的能力极限。
也就是说,当前我们传统的销售顾问的接待模式,将向销售顾问和大模型人机交互模式进行转换。
再一个就是我们整个AIGC的宏基智慧助手。
传统宏基产品造型设计师,他在研发设计时有很长的思考时间,一笔一画进行绘制在。
同一个产品周期,一个设计师的能力上限是绘制500张这种效果图,然后通过不断的提炼和优化,最终形成5个方案。
但是通过AIGC,设计师可以把他的想法形成prompt提示词,然后通过AIGC,生成4000+效果图,然后通过不断的优化和迭代,最终会形成5个方案。
在这个循环反复的过程中,不仅仅提升了设计师的设计效率,还给他提供了源源不断的设计灵感,提升造型设计质量。
还有一个应用就是代码生成。
中国一汽经过这两年的数字化转型,始终坚持一个理念,就是基于原生框架,坚持产品自研。
过去一年,我们已经开发了6100万行代码,我们也沉淀总结了开发规范和开发标准,这也就为大模型的应用,大模型辅助代码生成,甚至大模型取代人工写代码,带来了可行性。
今年我们提出了一个目标,要在2024年底将代码工时砍半,当前我们的全量开发工程师已经开始用了通义灵码,经过初步验证,通义灵码可以提升10%~15%的开发效率。这距离我们年度工时减半的目标还有一定差距,后续我们将依托于通义灵码进行微调,去构建中国一汽的代码生成大模型GPT-Code,后续我们会将我们的代码测试、代码评审、前端代码,都基于这种GPT-Code去自动生成,后端代码的辅助全部交给大模型,最终去实现我们2024年代码工程减半的这么一个目标。
为了保证各业务领域AI创新工程的全面达成,我们整个AI团队会持续不断的提供五大举措进行保障和助力。
首先,我们要建设模型广场,要适配主流模型框架,形成灵活接入各种开源模型的能力。阿里云的百炼平台的能力就非常强壮,我们用百炼平台时,会灵活去选择各种测试可用的开源模型。
第二,我们要构建云上训练以及本地推理的百卡级的算力底座。因为我们认为敏感数据还是不要出域,所以推理过程一定要在本地,但是训练过程中我们可以用假数据进行云上训练。
第三,我们要建设AI资产管理中心,要实现AI资产的快速复用。AI资产管理中心会沉淀我们AI模型、数据、工具链以及prompt层工程模板,整个数据资产都会沉淀在里面去。
第四,我们要通过AI实现业务单元的联动。
第五,我们要打造人工智能全生命周期的运营和管理能力,也就是说。中国一汽依托于业务单元孪生,我们打造了云工作台,实现了我们全量业务的在线,我们后续将以AI+能力,驱动业务重构,实现大模型和业务单元的一个深度融合,全面变革企业的业务模式,驱动企业全面焕新。
到2025年,我们的目标是业务单元AI化率超过50%,最终实现业务效能的跃迁式增长。
以上是我的分享,谢谢大家。
文章来源:亿邦动力