日前,展现了 Agent 智能体技术赋能零售业、制造业等场景的全新范式。实在智能还宣布,打造 Agent 智能体软硬件整体解决方案,与华为昇腾、华为鲲鹏、天翼云、拓维信息、浪潮信息、首都在线等合作推出一体机,以此加速智能体在企业端的落地应用。
在发布会上,实在智能介绍了面向未来企业应用智能体的最佳解决方案 —— 企业大脑。它能够更好地将通用智能体融入众多企业复杂的业务流程之中,助力实现企业级的商业化应用。
通用智能体:无需 API,操作任意软件系统
作为 AI 行业的准独角兽企业以及国家专精特新 “小巨人” 企业,实在智能已先后推出了三代 “数字员工”。其中,2023 年 8 月推出的第三代实在 Agent 通用智能体产品,在全球范围内实现了技术超越,领跑行业赛道。
据介绍,通过在自研流程自动化引擎、多模态大模型 TARS-VL、自动仿真技术、可变形矩形卷积和卷积核分配等方面的技术攻坚,实在 Agent 在步骤拆解、组件生成、通用理解、工具链接等方面得到了显著提升。此次发布会上推出的实在 Agent,在关键指标上比国际主流模型高出 10%。
目前,实在 Agent 已能够精准理解用户意图,将用户口语化描述的任务拆解为流程和步骤,并自动操作 PC 电脑、手机、平板、车机上的各种软件 / APP。它助力政企客户应用 “人工智能 +”,实现提质、降本、增效及数字化转型,是典型的 “新质生产力”。
发布会上,实在智能介绍了实在 Agent 在不同场景的工作案例。实在 Agent 承担了诸如舆情分析员、视频剪辑经理、财务报销专家等多类工作岗位。
例如,点击实在 Agent 页面的 “舆情分析即时助理”,系统会默认输入一个带有品牌名的指令示例(用户可根据自身需求修改品牌名)。这个已训练好的助理会在微信、知乎、微博等三个平台提取数据并进行汇总分析。
按下回车键进入任务执行页面,经过短暂的任务拆解,点击执行按钮,“舆情分析即时助理” 便进入工作流程。电脑会自动打开浏览器,在这三个平台进行数据提取,最后通过大语言模型生成舆情报告。以下是全部操作流程的视频动图。
对于这类在多平台提取数据的应用,以 RPA 为底层技术的实在 Agent 可谓驾轻就熟。整个执行流程大约仅需 3 分钟。若采用仅靠屏幕截图识别定位 GUI 元素的纯视觉 CUA 智能体,所需时间将翻倍,且任务可能无法完成。
此案例调用的智能体由官方发布。目前,实在 Agent 已上线 8 个常用智能体,用户可随时与这些智能体对话,布置所需任务。若这些智能体无法满足个性化需求,用户还能自行创建面向自身业务应用的智能体。
企业大脑:从“工具”到“生产力”的飞跃
企业大脑,是实在智能的又一 “奇招”。
当通用 Agent 厂商还在全力争夺 C 端用户的注意力时,实在智能已悄然以 “企业大脑” 的角色,开启了 AI 应用在企业级市场下半场的竞争。
在发布会上,实在智能抛出了一个关键的行业命题:当企业级 AI 应用面临 “能用但不好用” 的困境时,如何通过技术栈重构实现从 “工具” 到 “生产力” 的质的飞跃?
当前,AI 在企业场景的渗透率已突破 43%(根据 IDC 数据),然而实际应用效果却不尽如人意。超过 60% 的企业 CIO 面临着三大困境:一是知识资产孤岛化,各部门散落的文档、系统数据难以形成有效的决策合力;二是业务场景割裂化,智能体仅能处理单一环节,无法实现跨系统协同;三是数据主权焦虑症,公有云部署带来的合规风险与成本失控问题。
在应用层面,智能体要真正实现落地,必须做到可控、稳定和高效。可控意味着过程清晰、结果准确率高;稳定指多次运行成功率高且结果稳定;高效即构建效率高。这三点,正是实在 Agent 满足商业化落地的三大核心能力。
基于这三大核心能力,经过众多客户案例的实践,实在智能通过沉淀知识和技能,打造出了企业级智能体解决方案 —— 企业大脑。发布会上,实在智能介绍了企业大脑的四大核心能力与服务:
专属的知识库 RAG:企业在生产经营过程中积累了大量文档和数据,这些是企业独有的宝贵资产,也是员工真正需要的知识,但通用大模型无法涵盖这些内容。企业可以将文档(如产品说明、公司规章)、数据(如经营数据、绩效数据)、系统(如 CRM、ERP)以及业务操作的 “技能”,沉淀到企业大脑中,方便员工通过实在 Agent 进行调用。
专属业务系统操作知识:经过多年信息化建设,企业内部已拥有多套系统,每套系统都有独特的业务特性和操作流程。智能体要实现自动化业务办理,必须理解这些系统的操作规范。实在 Agent 具备原先 RPA 和 IPA 的能力,企业可依托自身已有系统(业务系统、管理系统、客户系统、运营系统等),搭建与自身业务相关的自动化操作流程(数字员工、软件机器人),方便员工通过实在 Agent 进行调用。
支持模型接入:大模型能力不断进化,许多尺寸较小的模型性能也日益提升,为企业本地部署大模型提供了便利。企业可根据自身业务特性,在实在 Agent 内接入适合的大模型。一些企业可能需要对模型进行微调,微调后的模型也必须能够灵活接入智能体平台,以发挥其最大效能。
支持私有化部署:出于数据安全、风控和监管等因素考虑,大型企业更倾向于私有化部署方案。与实在 Agent 配套的数字员工运营管理平台可在多种环境中进行私有化部署,支持国产化适配,具备账号授权、角色管理、同步企业组织结构等多种功能。
手机 Agent:口袋里的 AI 助手
在发布会结尾,实在智能公布了手机 Agent 助手的最新进展。基于实在 Agent 的多模态交互能力,实在 Agent 能实现 12306 自动开发票、热点信息智能生成、车机交互等自动化场景。
例如,在 “12306 自动开发票” 场景中,用户对手机说出需求,实在 Agent 就能将 12306 软件中的待开票订单自动申请开票,并发送到关联好的企业邮箱内,让差旅报销更便捷、智能。
从发布会公布的视频总结来看,手机端实在 Agent 是基于 PC 端屏幕语义理解技术 ISSUT,重构手机端元素识别能力,并从底层进行原子化封装,为 “手机 TARS 助手”(手机端实在 Agent)的交互、流程调度提供技术支撑。
此外,手机端实在 Agent 还提供了丰富的自动化流程,用户可以根据需要自主调用,也可通过定时执行、API 触发等方式,满足 B 端用户使用手机智能体辅助办公的需求。
除此之外,实在智能也会逐步开放 Agent 在人形机器人、机器狗、车机、智能家居、VR 眼镜等各类智能硬件上的使用功能。当实在 Agent 全方位融入生活工作时,也就意味着可以用 AI 掌控万物。
这次发布会的主题是 “与 AI 共舞,掌控万物”,这八个字隐含了两层意思:“与 AI 共舞” 意味着人机协同,是当下人工智能发展的合理选择。“掌控万物” 则强调智能体的核心能力,它能在虚拟环境中代替人操作软件系统内的所有事物。孙林君如此解释道。
这,应该也是实在智能面对未来人工智能广阔前景的终极愿景。
注:文/龚作仁,文章来源:Laborer,本文为作者独立观点,不代表亿邦动力立场。
文章来源:Laborer