文丨胡镤心
编辑丨董金鹏
【亿邦原创】当行业专家、投资人和创业者还在分析这一轮大模型驱动的AI浪潮有哪些机会时,工业AI企业已经先行一步。
4月13日,创新奇智推出生成式AI产品——“奇智孔明AInnoGC”,基于创新奇智正在建设的工业预训练大模型,面向制造业垂直场景,提供内容生成和代码生成等能力。
同一天,阿丘科技推出升级版缺陷生成平台AIDG,通过AIGC技术,解决AI质检中数据收集慢和标注成本高等问题。
计算机视觉是AI应用的主赛道,AI质检是计算机视觉中最成熟的场景之一。
据第三方机构和沐智讯的数据,2021年,AI工业质检融资21起,2022年融资19起。近三年,上市的AI工业质检企业超10家,如创新奇智、奥普特和凌云光等,启动IPO的相关企业超20家,其中埃科光电、思泰克等已过会。
腾讯云工业AI产品总监黄强曾表示,腾讯在AI质检上看到一个千亿级刚需市场,“单是3C电子产品的人工检测就有近300万人,按照一个人8万元/年的用人成本,将是一个2400亿规模的市场。”
另据IDC(Internet Data Center,互联网数据中心,简称IDC)数据,到2025年,国内工业AI质检的市场规模将达到62亿元,距离千亿级市场规模仍有数倍增长空间。
尽管市场空间巨大,AI质检公司的日子却并不好过。创新奇智招股书显示,2018年、2019年、2020年及2021年前三季,创新奇智经调整亏损净额分别为4540万元、1.6亿元、1.44亿元以及8100万元。
同时,新一轮AI技术正在改变AI质检公司的成本结构。过去一年,创新奇智提升平台能力与产品标准化程度,建立智能算法引擎,降低模型训练成本,提升AI迁移能力。2022年,创新奇智营收15.58亿元,同比增长80.88%;调整后净亏损1.38亿元,净亏损率同比缩窄46.1%,亏损大幅收窄。发布财报后的第一个交易日,创新奇智股价收涨34.38%。
AIGC能否成为AI质检行业腾飞的突破口?这一轮AI浪潮如何在应用端落地?大模型技术会给制造业带来哪些根本影响?
01
节约50%费用
AIGC落地潜力有多大?
在创新奇智推出生成式AI产品“奇智孔明AInnoGC”时,百度ACG算法工程师明阳还在感慨,创业公司跑得太快。
明阳介绍,对质检行业来说,从去年开始的以大模型为代表的AI变革,首先改变了AI质检中缺陷图标注的成本与周期,也就是通过AIGC生成缺陷图,提升AI上线速度和泛化能力。
在创新奇智CEO徐辉看来,人工智能带来的新思路是,通过大模型帮助工业企业更快构建符合具体场景的小模型,比如快速生成高质量生产数据,指导机器人或产线完成各种复杂的任务等。
不过,百度的大模型+AI质检还处在预研验证阶段,创业公司的AIGC应用已经上线。
4月13日,阿丘科技发布升级版缺陷生成平台AIDG,可以通过AIGC将多种缺陷生成在同一张图片,解决样本收集慢、标注成本高的问题。
阿丘科技创始团队来自清华AI实验室,目前为AI质检领域的头部企业。
阿丘科技首席科学家吴雨培在发布会上介绍,通过将简单的图像描述输入Stable Diffusion框架,可以生成多样的真实的缺陷仿真图。比如,通过拖拽或涂抹两种不同类型的缺陷,即划伤和脏污,然后通过缺陷位置掩码图进行描述,输入Stable Diffusion框架,就可以得到一张可用的缺陷仿真图。
图片来源:阿丘科技官网
AIDG平台可以把划伤、凹坑和脏污聚集在一张图上,训练集压缩了66%,短时间内将过检指标降低10%左右,使漏检指标降低约20%,将训练时间缩短30%。
图片来源:阿丘科技官网
更重要的是在产线迭代中,面对新的产品型号,只需要将旧型号的缺陷直接生成在新型号上,无需收集样本,即可直接完成模型训练。“AIDG 1.0解决了单一型号单一类别缺陷的生成和自动标注问题,AIDG 2.0要解决跨型号多类别缺陷生成和自动标注问题,提升AI的批量化复制。”吴雨培总结。
同在4月13日,创新奇智推出生成式AI产品——“奇智孔明AInnoGC”,可实现内容生成、智能问答、多轮对话、推理能力和代码生成,满足制造企业的个性化需求。
创新奇智由创新工场孵化,成立于2018年,李开复担任董事长,CEO徐辉具有20多年B2B企服经验,曾任微软大中华区副总裁,CTO张发恩曾任百度云计算事业部技术委员会主席。2022年1月,创新奇智在港股上市,主要产品包括机器视觉智能平台ManuVision、边缘视频智能平台MatrixVision、分布式机器学习平台Orion和 云平台Cloud,合称“MMOC人工智能技术平台”。
其中,机器视觉智能平台ManuVision预置了大量行业知识和经验,包括面板半导体、3C电子、汽车装备、新材料等;ManuVision还跟AInnoGC叠加,通过AIGC技术学习已有和公开数据集,生产缺陷图,解决样本量不足的问题。
而奇智孔明AInnoGC不仅拥有产线布局生成能力,可帮助工厂自动规划生产产线和仓储区域优化布局,而且拥有对话能力,可在AI实训中心,基于现有工业知识图谱回答问题。
比如,奇智孔明AInnoGC不仅可以统计工厂产品的产量和良品率,还可以对良品率做出分析。
图片来源:创新奇智官网
基于创新奇智的实践,张发恩认为,利用大模型、小样本学习和AI数据生成技术,预计可以使客户节约50%的费用,训练时间有望降低到原来的1/3。不过当前,这三者都还不够成熟完善,仍处于探索阶段,也都需要持续的实践经验和数据补充。
02
找到突破点
AI质检出现高增长
AI圈儿里有个玩笑,什么是人工智能?答案是先人工,后智能。
“只有先堆上去足够多的人力,才轮到智能。”胡威解释说。胡威从事工业AI质检已有7年时间,在这段职业生涯中,最令他崩溃的不是写代码和调算法,而是搜集缺陷数据;搜集缺陷数据往往耗时数月,做好的模型刚跑半年,产线升级,他和团队又得从头开始。
胡威的团队在苏州服务3C代工厂的结构件质检,设备导入周期平均 6 个月,单产品模型训练周期 2 个月,每个项目平均要有 5 位工程师驻场实施,整套成本高达 40万-100 万元。
上线周期长的最大原因是样本难收集。不同的人对同一缺陷有不同的标注,同一个人在不同的时间段,对同一缺陷的标注也不一样,由此缺陷标注经常产生冲突,导致模型迟迟无法提升。
同时,3C产线工艺波动大,“果链”(苹果供应链企业的简称)代工厂的产线每两年要彻底更换,模型无法复用,算法重新训练。
目前,唯一的方法就是等。“我们只能建立一个专业的标注团队,但是样本量越大,标注成本越高,上线周期越长。”胡威想起来就苦笑。
图片来源:IDC
对于从事AI交付的李湘来说,噩梦则是数字化设备交付之后,调试团队迟迟无法撤离。
李湘举例,比如最常用的几何匹配算法工具,需掌握较专业的图像处理知识和几何匹配算法的基本原理,才能进行调试;而一般的应用工程师,即有图像处理背景与编程背景,且硕士及以上学历,才能把参数调整到比较好的状态。
就算这样,在最麻烦的项目中,调试人员两年多无法撤离,给他造成了巨大的心理阴影。
这些都是AI落地中的常见难点,也是长期以来工业AI难以普及的根本困境。有从业者举例,一次卖出25套设备,收费300多万元,本来是个喜事儿,结果交付用了几百人,人力成本200万元,加上硬件成本,基本没有利润。
反观大厂,也是如此。一位从业者说:“大厂在这方面的团队都在1000人左右,每年赔十几个亿不在话下。”
这个亏本赚吆喝的时代,被从业者们称为“工业AI 1.0”时代。
不管是国内的阿丘科技、创新奇智和思谋科技,还是美国的康耐视(COGNES,计算机视觉公司,成立于1981年),都是算法起家,早期都需要投入大量人力收集图片、训练模型、研究算法。
彼时工具链不完善,落地方法不成熟,只能靠一个一个做项目,一点一点积累场景数据,实现从0到1的突破。
转机发生在2019年。阿丘科技CEO黄耀认为,这一年是“工业AI元年。”
阿丘科技完成一个3C结构件的检测,这是一个塑胶件、金属件等多种材料组合的结构件,异形、缺陷种类超三十种,并且形态多变,传统机器视觉难以识别。阿丘科技通过深度学习解决了复杂场景下的识别问题,而且在两周内做出demo,验证后快速上线。
黄耀发现,只要是人眼可以识别的缺陷,深度学习都可以识别。凭借特征提取能力和对高维数据的表征能力,深度学习能够容忍复杂图形中的自然变化,区分机器视觉无法识别和分辨的缺陷,令检测精度大幅提升。
在一个传统机器视觉束手无策的场景中,深度学习快速崛起。
除了阿丘科技,创新奇智、思谋科技、康耐视等厂商都开始把深度学习落地到工业场景,AI质检出现高增长。
创新奇智招股书显示,2018年、2019年、2020年及2021年前三季,创新奇智营业收入分别为3720万元、2.29亿元、4.62亿元、5.53亿元,报告期内的总营收12.8亿元。2018-2020营收复合年均增长率达到252.5%,2021 前三季同比增长85.8%。
阿丘科技也在结构件、模组、包装、快消品、食品饮料等传统制造业众多场景批量落地。“这些行业的共同特征是问题驱动,而且问题只有用AI才能解决。”阿丘科技技术VP钟克洪介绍。
IDC预计,2022年,计算机视觉中纯用于质检这一细分场景的软件类和服务类营收超过10亿元,预计2025年将达到62亿元规模。
03
工业大模型
真正的国家基础设施
不论创新奇智推出的奇智孔明AInnoGC,还是阿丘科技的缺陷生成平台AIDG,都在大幅降低AI的应用成本,提高AI的迁移泛化能力,而这也是未来三年工业AI发展的重心。
黄耀认为,过去三年AI质检的发展侧重于同一场景的复制,也就是用同一个模型解决同一场景的问题,比如在消费电子领域,做好一个结构件的检测之后,再寻求同类场景的横向复制。
2023年开始,AI的迁移和泛化能力提升,AI质检从单场景复制走向多场景迁移,比如从iPhone的金属件检测,到 Macbook、iPad的金属件检测,甚至迁移到汽车的金属件检测。这些结构件材料相似,工艺相似,AIGC可以将相似的缺陷快速呈现在一张缺陷图上,加快项目落地。
同时,从一种材料向另一种材料的迁移也在加速中。虽然材料和工艺数据不同,但工具链可以复用。
2025-2030年,AI质检将进入全面普及时代,最终实现“AI for Every Factory”。“所以工程师可以全力拥抱AI,把AI当成一个强有力的武器,工业视觉的研发速度和研发成本就会下降。”黄耀说,这是他在尝试过所有大模型产品之后的感觉。
钟克洪认为,根据杰弗里·摩尔(Geoffrey A. Moore)的跨越鸿沟理论,工业AI视觉已经突破临界点,接下来将进入行业普及期。
在AIGC能力加持下,工业AI企业的产品矩阵也在发生变革。
钟克洪认为,从大的维度看,工业视觉解决方案会按两个大的方向来进行演进:
轻量级场景更加强调一体化解决方案,更加简单易用。整个行业里AI的平均成本将会极大下移。
复杂场景会更加强调通用解决方案,主要通过通用模型,降低综合成本。
无论阿丘科技还是创新奇智,下一个焦点都是从算法模型向通用模型的演化。AIGC对AI质检的加持已经让工业级大模型的威力初露端倪。
中科院自动化所博士生导师、中科行智创始人彭思龙教授认为,工业领域需要一个相对通用的大模型,这样每个具体场景中,只需要进行少量样本标定,就能实现落地,而且全世界只有中国有这个机会和能力。
尽管中国拥有全世界最齐全的工业门类,即41个工业大类、207个工业中类、666个工业小类,但训练大模型的数据从哪里来,谁来组织,谁来获取,如何与企业沟通解决私密性问题,都成为新问题。一些制造业龙头企业,忌讳将内部数据交给服务商。
即便如华为这样的巨头,也只有局部数据,而创业公司只能够通过项目积累数据,“这里需要建立一套机制,只有国家来思考这个问题,地方政府都很难搞定。”彭思龙说,“即使国家队出面,企业数据也不会白给。”
思路之一是发改委或工信部出面组建团队,每个行业挑前10个龙头企业给予补贴,由龙头企业提供数据,相当于国家做一个工业基础设施,以订阅的方式提供给所有制造业企业,象征性地收取部分订阅费。
这是真正的国家级基础建设。
工业级别的大模型一旦诞生,将有力推动传统制造业的转型升级,产业链转移也将停止。彭思龙说:“当工业大模型出来以后,我比较看好传统产业升级,传统产业智能化这一块一旦完成,中国真的就是世界工厂。”
(注:文中明阳、胡威、李湘为化名。)
文章来源:亿邦动力