随着DeepSeek等大模型的普及,“万众齐用大模型”的时代骤然降临,行业落地空前热闹。但热潮之下,也藏着焦虑:每一次技术革命都曾带来生产力飞跃,而眼下真正能扎实落地、实现效率跃升的案例仍不多。
要想实现AI真正落地,有什么更有效的路径?大模型擅长什么?行业大模型到底该不该训练?行业知识库如何构建?数据从哪来、怎么治理?这些问题,在AI真正成为“生产力工具”前,绕不过去。
在5月10日由中国企业改革与发展研究会主办的“央企AI+大模型应用论坛”上,中建材信息副总经理、信云智联总经理王乔晨展示了“大小模型协同”的安全生产管理实践。
该系统已覆盖中国建材集团626家制造型企业,接入摄像头4.6万台,运行算法4万多路,这一落地规模和效果,令业界人士印象深刻。其背后,是一套“不迷信模型”、强调系统工程与长期价值的工业智能化路径——既“做面包”,更“种粮食”。
01
大小模型协同
人始终要在流程中
信云智联起步于视觉小模型时代。当时,市场上视觉类人工智能企业,大都投入到智慧城市、公安或交通这类大市场上,而信云智联有着很强的行
业背景,它是中国建材集团旗下中建材信息的全资子公司,专注于数字化、智慧化转型服务。
信云智联很快发现,工业场景中围绕“人、设备、环境”的需求,与那些大市场有着明显不同。于是,公司决定组建算法团队,专注开发契合工业需求的视觉小模型。
那时,为了在工业企业中落地视觉模型,一些人工智能企业要求用户要拿出数万张图片来训练模型。“但这种‘把弓拉满’的做法,在拉弓过程中就停了,因为用户已经接受不了了。”王乔晨观察,因此,他们必须要走另一条路——基于小样本生成可用模型,并在实际应用中持续迭代。
他们的策略是“小步快跑,先做起来”,在技术选择上也要更务实,不迷信时髦技术,将深度学习、机器学习、模式识别等多种技术并用,根据场景选择最适合的工具。得益于自主算法团队,信云智联在安全生产管理领域,已开发出70多种适配场景的算法。
不过,视觉小模型的局限性也很明显。因为训练数据不够多,泛化性较弱,一旦现场环境发生变化,模型可能就无法准确识别。而工业场景的变化极为常见,导致模型需要频繁调整,后期运维成本居高不下。此外,即使是百万次、千万次级别的调用,只出现一两次误报,用户依然难以接受。
信云智联也在寻找突破路径,直到大模型的到来。“我当时被一个场景‘震’到了。”王乔晨告诉数智前线。在一个水池的安全监控案例中,传统做法需要根据水位变化,手动调整电子围栏。而大模型具有通识理解与推理能力,能够识别水面变化并自动调整边界。这一能力让王乔晨意识到,大模型有潜力重构传统AI应用。
不过,并不是所有问题都需要大模型重做。“像水泥产线上皮带撕裂的检测,小模型做得已经非常好了。如果大模型再做一次,经济价值并不高,客户也不会为此支付更高的算力费用。”信云智联首席架构师吴振刚说,小模型轻量化、可集成到终端摄像头中,性价比很高。
同时,在推动大模型落地过程中,必须重视数据安全。尤其是在开放问答等场景中,大模型可能存在信息泄露风险,因此,涉及敏感数据或高安全等级的业务场景,并不适合直接使用大模型,而应根据实际情况采取更稳妥的技术。
信云智联提出了“大小模型协同”的策略。目前,大模型主要的突破集中在语言领域,而计算机视觉(CV)和多模态大模型仍处于发展阶段。通过大小模型配合,既能发挥小模型高效、低成本的优势,又能利用大模型的推理与通识能力,可能形成兼顾工程可行性与智能水平的选择。
这一协同模式目前主要聚焦两大目标:其一是降低误报率。小模型快速识别出不安全因素后,由大模型进一步校验。其二是处理复杂行为链识别。例如,小模型通过电子围栏识别到有人进入危险区域后,大模型判断其是否有攀爬等危险动作,从而完成更深层次的场景理解。
目前,大小模型协同在安全生产领域处于探索和验证阶段。“最终这道防线,还是人。”王乔晨强调。尽管现在安全生产系统中已有“虚拟安全员”,但无法取代人类的核心作用。“安全生产管理是基于责任体系来构建的,AI不能代替人来承担责任,因此,人必须始终在流程中。”
目前,中国建材集团的这套智能安全生产管理系统,每天产生大量行业级安全数据,为系统的持续优化提供坚实基础。
除了安全生产,信云智联也在设备预测性维护、工艺优化等高价值场景中推动AI落地。以水泥工艺为例,工艺过程极为复杂,涉及大量物理、化学反应。虽然中国建材集团旗下的研究院所在干法水泥工艺机理上有长期积累,但仍不能描述所有变化。信云智联将AI算法与工艺机理结合,取得了“1+1>2”的效果。
“我们有场景,也有工艺机理知识与数据资源。”王乔晨说,“我们就在这些要素之间,起到嫁接的作用。”信云智联不拘泥于技术潮流,从实际需求出发,推动AI真正服务于工业落地。
02
系统工程的力量
行业大模型该不该训?
实际上,信云智联的智能安全生产管理系统,集中体现了“系统工程”的价值。这些长期在一线落地的团队认为,当前阶段,最现实、也是最有价值的路径,不是盲目追求时髦技术,而是通过系统工程能力,将现有技术转化为实际可控、稳定可用的生产力。
这里提到的是“系统工程能力”,而非盲目追逐行业大模型的创新。一些业界人士认为,要解决行业问题,必须训练行业大模型。“我个人认为,在很多问题上,训练行业大模型未必是一个最有效的手段。”王乔晨说,“行业大模型的训练成本很高,但凡要动到模型参数,对算力和数据质量的要求就很高。如果准备不足,反而事倍功半。”
“训不训练行业大模型的边界在哪?就像药物研发,数据由专家标注,通用大模型的能力很难达到。”王乔晨说,“而在工业场景下,如果没有触达到工艺机理深度,行业大模型可以先不着急做。”因为现在的通用大模型几乎每周都有更新,可能你刚训练出一个行业模型,下一周通用模型新版本的能力就把你碾压了。
“而且,生产数据每天都在变,要把这些数据以训练方式,更新到大模型中,其实很不划算。”吴振刚补充道,“行业大模型真正该训的,反而是本专业的逻辑推理能力,而不是灌输记忆型数据。”
像严谨、共识的知识和公理化的数学推理能力,适合内置于大模型,而每家企业的专属生产经验,需要动态更新和注重数据安全的信息,反而适合基于向量数据库,在大模型之外建立知识库。
因此,信云智联更倾向于通过系统化的工程能力,将通用大模型的价值发挥出来。比如构建高质量的行业知识库,就是推荐的一种方式。
吴振刚介绍,大模型推出后,行业知识库的构建和使用门槛已大大降低了。传统的知识图谱构建方式,抽取效率较低,难以快速适应个性灵活的行业场景需求。
现在,通过RAG(检索增强生成)、大模型逻辑推理、向量数据库快速检索的大模型生态技术组合,企业只需对现有文档进行盘点、分类,即可快速构建初步的知识库。再通过实际使用中,各种智能体的验证与反馈,持续完善与修正,从而建立有效的企业级知识工程。
系统工程的价值也涉及高质量数据、算法设计、低代码、人机协同等。信云智联倡导“小算法大作用”的理念,认为很多实用场景未必只能依赖某个模型,而是通过轻量级的分治策略获得更高的投入产出比。
例如,现在有种倾向是过度追求算法极限,在安全生产中,不仅要识别安全帽佩戴情况,还要识别帽绳的系法这类细节。这些需求对算法挑战极高,但落地价值往往不能覆盖成本。而从系统工程思维切入,借助相对简洁成熟的电子围栏、定位传感器、人机协同机制,就能构建起更具性价比的解决方案。
这种方法遵循了“20/80法则”:抓住最关键的20%,释放出80%的价值。比如,在高风险区域,可以先用电子围栏感知是否有人闯入,再通过定位传感器判断人员身份,而不必挑战在戴口罩且光线复杂的环境下仍然精准识别人脸的极限任务。
在系统工程的框架下,应用大模型重点是将“原生能力”用好。以安全生产为例,基于大模型的安全知识问答,或是让管理者通过自然语言与系统交互,无需点击菜单,系统就可以理解语义执行命令,成为智能化“导航台”,这正是通用大模型擅长的方向。
信云智联还构建了面向行业的智能体商店和工程平台。智能体一端连接行业场景,一端调用各类大模型,按需生成智能体,快速落地到具体业务中。这背后并不是“搭积木式”的简单拼装,而是需要对场景需求、模型能力、数据治理、行业知识库、低代码、集成等多维度进行精细打磨与系统化组合。
在当下大模型快速迭代的背景下,信云智联的策略是“以快打快”,通过小步快跑、快速验证,及时释放价值,形成可持续的节奏。哪怕未来模型更新“碾压”了当前能力,系统已经产生了实际效益。
03
“做面包”和“种粮食”
在众多服务数字化、智能化转型的企业中,信云智联定位在行业市场,扮演“最后一公里”落地的关键角色。
“最后一公里”,不是去做纯定制化的项目公司,因为这类市场空间有限,还容易受到软件外包服务企业的挤压;也不是走向通用市场,与大厂正面竞争。
信云智联背后有较深的工业背景,更适合扎根在工业垂直领域,去服务那些数字化空间足够大、潜力足够深的行业。比如一些工业行业数字化、智能化空间可以达到千亿级别,足够支撑一家企业的长期发展,也契合信云智联当下的发展阶段。
在这样的定位下,行业Know-How成为核心能力。“行业Know-How结合数字化,是我们的一道门槛。”王乔晨举例,在做云计算平台时,我们就在通用PaaS之上,定义了一层行业PaaS,把行业知识体系和软件平台融合。
“比较幸运的是,行业的数字化、智能化推进过程中,最后一公里落地至关重要,这部分生态空间一定是存在的。”王乔晨说对团队的要求是:“持续奔跑,永远领先同行半步。”这“半步”,靠的不只是代码,而是理解、经验和体系。
以前,代码被视为像“金子”一样的核心资产。但现在,大模型的代码生成能力越来越强,一个系统的复制,可能只需要让模型“看一眼”。因此,信云智联在重新思考自己的核心竞争力,不只是“卖工具”,而是深入理解客户业务,通过服务实现业务价值,成为客户数字化转型过程中的技术伙伴。
以水泥行业的安全生产管理为例,哪些是不安全因素?摄像头该如何布置?算法如何训练和适配——这些是靠对场景的理解、对系统落地细节的把控,以及对高质量数据的积累。“以前我很关注我们数字化能力到底领先别人多少,但现在看,真正的门槛一定是很难的事,比如行业知识库和高质量数据集,是谁都绕不过去的。”
行业数据是一种像金矿一样稀缺而有价值的资源,可以成为企业与竞争对手之间的重要壁垒。信云智联能获取覆盖全国1/4水泥产能、300多家窑企的实时数据,这些数据数量庞大且具有代表性,然而,要想充分发挥这
些数据的价值,还需要进行数据治理。
数据治理是一项系统性极强的工程,涉及大量行业标准,而这些标准在很多场景中尚未建立。比如想获得水泥生产过程中某个工艺段的电耗数据,行业并没有规定统一的采集点;再如,水泥从石灰石烧制成熟料,产量很难直接测量,作为一个过程变量,需要借助其他参数间接计算得出,然而行业内对此的计算逻辑也缺乏统一标准。
吴振刚告诉数智前线,在企业级市场,100%标准化几乎不可能。实际可行的路径是将80%的内容标准化,而剩下20%需要“拼缝”,也就是根据客户化场景进行经济、灵活的适配。实际上,这也对大模型应用能否真正落地,起到决定性作用。“而已经标准化的内容固化到工具,结合标准的实施方法,就形成了一套可复用、体系化的技术能力。”
此外,和大厂强调的通用能力不同,信云智联在构建数据平台时,更强调行业场景适配。他们会根据特定场景的要求,把各种SQL脚本、配置参数、逻辑模型文件等,内置到数据平台的各类场景模板中,帮助客户避免从零开始重复建设。比如在安环系统中,统一各工厂的数据标准,再基于模板做适配和复用,大幅提升了实施效率和质量。
数据治理是个“短板工程”,要求业界将一块块短板补上。“大家都愿意做面包,因为面包的增值最大,但没人愿意种粮食。可没有粮食,哪来的面包?”王乔晨说,“我们现在就在种粮食。”他们希望通过两三年的周期,借助新一代信息技术,全面提升“数据粮食”的产能和质量,而那时,信云智联的行业门槛也就真正立起来了。
文章来源:数智前线