4月2日,中国服装智能制造联盟专家组副组长、东华大学教授闻力生分享了关于ChatGPT与服装智能制造的主题演讲,以下是他关于服装智能制造的诸多思考。
ChatGPT是什么
1、OpenAI公司推出了ChatGPT!
OpenAI是美国的人工智能研究公司,2015年在旧金山成立,公司的目标是推进发展人工智能,造福全人类。OpenAI公司是由埃隆·马斯克(Elon Musk)与山姆·阿尔特曼(Sam Altman)等人联合创建。2018年公司与微软公司合作推出GPT-1;2019年推出预训练模型参数为15亿的GPT-2;2020年发布了参数达到1759亿的GPT-3;2022年在GPT-3.5的基础上推出了ChatGPT。所谓ChatGPT是在GPT基础上进一步开发的自然语言处理(NLP)模型,可以俗称它为“聊天GPT”,它强化了人工智能的语言对话能力,引起全世界广泛关注,见图一。
图一GPT发展历程
2、这里所说的GPT是什么呢?
GPT是英文字首(Generative Pre-trained Transformer),可以叫“生成性预训练变换模型”,也可以叫“生成性人工智能”,是基于自然语言处理NLP基础上发展起来的大数据、大算力、大模型。GPT是一种计算机自动生成文本和图像的技术,它使用了大量的训练数据,以及深度神经网络的技术,可以让计算机自动生成文本、图像和视频,而无需人工干预。GPT的出现,让AI技术发展到了一个新的高度,可以实现更多的功能,比如自动生成新闻、撰写文章、制作视频等。现在的GPT就是新一代人工智能发展的代表,它可以说是以现在的机器学习和深度学习等为主体,在其基础上参考人脑的计算机制,构建机器的学习和推理智能系统,不管是OpenAI的GPT系列还是Google的T5系列、BERT系列,都是参考人脑的计算机制,构建机器的学习和推理智能系统的,这些都是在Transformer模型基础上发展起来的,见图二。
图二GPT发展基础
Transformer模型是深度学习中的一种神经网络模型,该模型是由Google开源的,目前Transformer模型已经成为自然语言处理领域中最流行的模型之一。由图二可知,类似于Transformer的模型有许多,其中一些主要的模型包括:BERT(Bidirectional Encoder Representations from Transformers):BERT是由Google在2018年推出的预训练语言模型,采用了Transformer模型的编码器部分,并使用双向的Transformer模型来对输入的文本进行建模;T5(Text-to-Text Transfer Transformer):T5是由Google在2019年推出的一种基于Transformer的通用文本转换模型,可以处理各种NLP任务,如文本分类、问答、文本摘要等;RoBERTa(Robustly Optimized BERT Pretraining Approach):RoBERTa是Facebook在2019年推出的预训练语言模型,它通过对BERT训练过程进行优化,提高了在多种NLP任务上的性能表现,等等。
现在大语言模型受到了人们的广泛关注,来自不同公司的大语言模型,像OpenAI的GPT-3、Google的PaLM或LaMDA、Meta的Galactica或OPT等,都是在相同的基本方式上构建的,都是基于Transformer构建的自回归、自我监督、预训练、密集激活模型。各种大模型表现类似惊人的能力,但目前的人工智能远远没有到达其能力的终点。那么未来大语言模型的出路在哪里?根据一些最新的研究结果提出,下一代大语言模型LLMS(The Next Generation Of Large Language Models)在以下三个方面发展:大模型可以用产生的训练数据来改善自己;大模型可以核查确认事实;向海量稀疏专家模型发展等等。
3、基于GPT-3.5基础上的ChatGPT有哪些作用?
2022年11月OpenAI在GPT-3.5基础上的推出的ChatGPT有哪些作用,我的观点如下:(1)我认为ChatGPT是AI时代最具革命性的技术创新,在通用人工智能技术AGI和人工智能自动生成内容技术AIGC发展上具有里程碑意义;(2)ChatGPT相关技术具有非常大的商业价值,使得搜索引擎在内的很多产品都面临被重构或者颠覆的机会,无疑会带来很多新的商业机会,整个NLP领域都会受益;(3)基于自监督预训练的生成大模型与基于少量优质数据强化学习反馈策略的学习范式,有望成为未来推动各个领域前进的动力,除自然语言处理NLP领域外,有望在生命科学、机器人、自动驾驶等各个领域引发新一轮人工智能热潮;(4)ChatGPT因其出色的文本生成和对话交互能力,以后写论文、写评论、写剧本、写代码等等,无所不能,特别是ChatGPT被集成到word、excel、ppt等工具软件后,将变革人们的办公方式,成为新的行业生产力工具。ChatGPT还将带动图像、音频、视频等形式的AIGC技术与产业发展,使得AIGC的内容更加丰富。
但是目前ChatGPT有几个缺点:(1)基于已有信息聚合生成,缺乏实时信息或背景知识,容易导致回答出错;(2)由于数据偏差,训练数据直接影响回答的质量,信息的真伪性是不确定的;(3)仅有归纳能力,缺乏推理能力。
4、基于GPT-4基础上的ChatGPT新版本上线联网了
ChatGPT刚刚推出,并成为历史上增长最快的消费者应用程序,可到2023年3月15日OpenAI又发布了基于GPT-4的ChatGPT新版本,OpenAI在其官网称《GPT-4是OpenAI最先进的系统,能够产生更安全、更有用的响应》。一般来说,GPT-4提高了ChatGPT的核心技术,使得它相比此前的版本,具有更广泛的一般知识和解决问题的能力,使得聊天软件能够以更高的准确度解决更难的问题。另外,它还增加了一些新功能,比如接受图像作为输入,生成标题、分类和分析。特别是当GPT-4被整合到微软一个名为Microsoft365Copilot中时,凭借它强大的图文处理能力,不仅可以帮你写各种文档,还能轻松地将文档转换成PPT、Excel、数据自动总结成图表等等,可以肯定的说基于GPT-4基础上的ChatGPT新版本上线,将是一场势不可挡的生产力革命。
5、由GPT-4到GPT-5研发被叫暂停
在GPT-4诞生两周之后,未来生命研究所发表了一封公开信,公开信题为“暂停巨型AI实验”。这封公开信指出,最近几个月,人工智能实验陷入了一场失控的竞赛,他们没有办法理解、预测或可靠地控制自己创造的AI大模型。人类社会对其可能造成的影响也没有做好准备。因此,公开信呼吁,所有AI实验室应立即暂停训练比GPT-4更强大的AI模型,为期至少6个月。截至目前,图灵奖得主Yoshua Bengio、特斯拉CEO伊隆?马斯克、纽约大学名誉教授Gary Marcus等1000多人已经在这封公开信上签名。世界上能否暂停超大模型AI实验?人们将拭目以待。
中国版ChatGPT技术并不落后
由于ChatGPT的训练过程所需算力资源大、标注成本高,目前国内暂未出现对大众开放的同类产品。但是很多大公司和高等院校都纷纷表示要研发国产ChatGPT,争取早日发布。例如百度、阿里、腾讯、京东和北大、清华、复旦等等。
下面我们分别介绍一些中国版的ChatGPT现状情况:2023年2月7日,百度宣布上线百度版ChatGPT—— “文心一言”,英文名为“ERNIEBot”。“文心一言”是百度基于文心大模型技术推出的生成式对话产品。“文心一言”究竟能真正实现类似ChatGPT的能力。国际权威咨询机构IDC发布《2022中国大模型发展白皮书》评估,百度文心大模型在产品、应用和生态能力上全面领先,百度文心大模型脱颖而出,位列国内大模型市场格局第一梯队;阿里达摩院在大模型各个方向都进行了探索,布局完整。早在2021年4月就发布了首个中文语言大模型PLUG(当时参数是270亿)。同年10月份,达摩院还探索实现了10万亿参数模型M6,M6模型将AI图片生成清晰度从OpenAIDALL·E的256×256成功提升到了1024×1024,效果十分惊艳;腾讯在大模型领域的布局早已有之,其“混元”系列AI大模型覆盖了NLP、CV、多模态等基础大模型以及众多行业领域大模型;极睿科技公司联合清华大学人工智能研究院、面壁智能、OpenBMB,即将发布基于中文的千亿大模型电商ChatGPT;2023年2月,来自北大的研究者提出了一种更符合人们日常交流习惯的新方法,一个类似ChatGPT版的名为ChatExcel模型的新应用,可以直接使用自然语言,动动嘴皮子就能对表格中的数据信息进行查询、修改等操作,就像是一个精通Excel的助手;2023年2月20日,复旦大学自然语言处理实验室发布了具备ChatGPT能力的语言模型——MOSS,并面向大众公开邀请内测。MOSS的基础功能与ChatGPT类似,可以按照用户输入的指令完成各类自然语言处理任务,包括文本生成、文本摘要、翻译、代码生成、闲聊等等;首个中文版ChatGPT——国产自研功能对话大模型元语ChatYuan,于2022年12月发布测试版本后,引起社会各界人士的广泛讨论,并且收到了用户的大量反馈和宝贵建议。而今ChatYuan版本又进行了升级,支持中英双语交互、多次编辑、上下文关联交互、模拟情景设定等多种新功能;创新奇智推出Castor体系(CastorMES PI产品)Castor体系将AI与生产运营管理相结合,旨在以平台的方式帮助制造业客户高效完成数字化、智能化生产落地;联汇科技首席科学家赵天成博士近期发布OmModelV3新版本,将提供一句话生成算法、自由定义需求、中英双语互动、智能报告等多个特色功能,用户可以通过语音或者文字等形式,自由提交任何需求任务,系统将根据任务给出相关反馈,包括音视图文等多个模态的结果呈现。现在OmModel已经实现在智慧电力、视觉监管、智慧城市、机器人、数字资产等领域的落地应用,等等。从以上现状情况可见,中国版ChatGPT技术并不落后!
ChatGPT将加速服装智能制造的实现
我曾经在https://chatgpteasy.net/#/网址上就智能制造一些问题和ChatGPT进行了对话,它说清楚了与智能制造关系,见图三。
图三 我与ChatGPT的对话
很长一段时间,人们仍然严重依赖手写代码来实现对机器人的控制,不过当ChatGPT出现之后,这种情况就可变了,因为ChatGPT的功能目前已扩展到机器人领域,可以用语言直接控制如机械臂、服务机器人、工业机器人、无人机等等。最近OpenAI公司投资一家名为“1X”的机器人公司,1X公司计划用这笔资金来加大力度研发双足机器人模型NEO,以及首款商用机器人EVE。EVE机器人具备轻柔地移动、操纵物体和与现实世界互动的能力,以探索人工智能如何在类人身体中形成,也就是我们通常所说的具身AI机器人,见图四。
图四EVE具身AI机器人
我曾经说过,机器人是实现智能制造最重要环节的设备之一,在智能制造中每使用一个机器人就会替代一个或多个员工。服装制造业实现的少人或者无人的智能制造一定要依靠机器人。
目前机器人完成任务的操作流程是从工程师或企业用户开始,需要他们将任务需求转换为系统代码。工程师在处于工作流程的回路中,他们需要不断编写新的代码和规范来纠正机器人的行为,这个过程是缓慢的、昂贵的和低效的,见图五。
图五 手写代码控制机器人的服务
但是在今天,因为ChatGPT是一个在大量文本和人类互动语料库上训练的语言模型,因此应对广泛的prompt和问题时,它可以生成连贯且语法正确的响应,因此人们与机器人的互动,不需要学习复杂的编程语言或机器人系统的细节,可以直接根据机器人要完成的任务,直接对话ChatGPT机器人,见图六。
图六 对话机器人ChatGPT在智能制造中的应用
在服装智能制造中,基于ChatGPT的自动机器人可以能够完成更快更多的任务,例如:ChatGPT可以用于实现智能优化设计,根据客户需求快速优化产品设计,提高产品质量;帮助企业实现供应链智能管理;自动控制生产线,并给出最优生产方案;自动检测产品质量,并及时发出质量报告;快速发现机器故障,以及提供维护建议;自动生成可视化的报表,使企业管理者快速了解生产状况等等。因此,有了ChatGPT对话机器人可以加速服装智能制造的实现。
机器人在服装工厂和车间的主要服务型式是衣料抓取搬运服务和替代人的操作服务,特别在我们组建的模块化制造过程中,例如设计制板模块、裁剪模块、缝制模块、整烫模块、折叠包装模块、仓储物流模块中,机器人不是充当主角就是配角,绝对是少不了的。例如:2021年中央美术学院设计学院采用“AI+人”工作模式,通过DeeCamp人工智能训练营,“基于AI对话生成的服装设计”作品, 见图七;2022年日本PLUG株式会社基于对话CHATGPT机器人进行的产品包装和服饰的设计,见图八;我国某衬衫企业生产的衬衫领子模块,将用智能缝制设备和CHATGPT对话机器人组成模块式加工工位。
图八 基于“CHATGPT+ 人”包装和服饰设计
图九 衬衣领智能模块式缝制
当然,因为服装智能制造复杂性,特别在衣料的抓取和传送以及协同要求得特别高,因此基于ChatGPT对话机器人还有待发展,例如人形机器人的灵巧手等,见图十。
图十 基于ChatGPT机器人进一步发展
ChatGPT开启了一种新的机器人工作范式,它可以允许非技术人员参加到机器人工作回路之中,在监视机器人性能的同时可以向大型语言模型(LLM)提供高级反馈,让机器人精、准、快的完成人们所交待的在智能制造中的各项任务,这既省了人的脑力,又省了人的体力。
本文为长三角(苏州)产业数字化创新中心专题专栏文章,更多专题内容可点击长三角(苏州)产业数字化专题
注:文/亿邦动力,文章来源:亿邦动力,本文为作者独立观点,不代表亿邦动力立场。
文章来源:亿邦动力