广告
加载中

大模型还干不掉BI

胡镤心 2025/05/15 20:36
胡镤心 2025/05/15 20:36

邦小白快读

大模型对BI行业的冲击与变革

1. 大模型降低BI使用门槛,通过自然语言对话分析数据,数据分析流程从多人协作简化为Agent独立完成。

2. 企业级BI面临大模型索引极限、数据安全、跨表准确率低(仅60%-70%)等问题,客户自建ChatBI尝试常因业务团队耐心耗尽而失败。

3. 当前BI厂商通过“指标平台”统一业务语义,解决自然语言到SQL的映射问题,并借助原子化架构灵活适应大模型升级。

4. Data Agent元年开启,BI能力从被动调用转向主动推送(如闭店报告自动生成),但企业AI预算普遍不足制约落地。

品牌数字化与数据应用趋势

1. 数据消费范式变革:从“人找数”到“数找人”,Agent实时推送个性化分析(如霸王茶姬门店经营报告),影响用户行为观察与产品研发。

2. 指标中台(如SwiftMetrics)统一跨部门指标口径,解决品牌多业务板块数据混乱问题,为精准营销提供基础。

3. 大模型幻觉导致字段歧义(如“销售额”定义差异)、财务指标误判等问题,需品牌建立数据治理体系规避风险。

4. 早期采用者画像:具有互联网背景、热衷新技术的竞争性企业技术团队,是品牌商获取数据智能红利的突破口。

BI行业市场机会与风险

1. 市场机会:Data Agent元年开启,企业需求从数据分析工具转向智能体服务,数势科技、帆软等厂商已部署云平台原子化服务。

2. 风险提示:大模型NL2SQL准确率不足、企业级数据安全硬性要求,导致自建ChatBI项目存活周期短(业务团队耐心约半年)。

3. 合作方式:服务商向前延伸业务经营服务(如网易数帆加持指标制定、数据血缘关联),卖家需关注“AI+场景+数据”闭环能力。

4. 商业模式挑战:企业服务可能从订阅付费转向结果付费,需提前布局服务价值量化体系。

生产数字化实践启示

1. 生产数据应用:通过指标平台(如EasyMetrics)构建跨数据源统一逻辑模型,解决工厂多系统数据孤岛问题。

2. 效率提升路径:将自然语言查询映射预定义业务逻辑(如0代码创建原子指标),降低一线人员数据使用门槛。

3. 安全实践:BI行列级权限自动过滤敏感字段(如身份证号),为工厂数据开放提供安全保障。

4. 转型参考:网易数帆从“数据治理”转向“数据赋能”,启示工厂数字化需同步培养懂业务的数据团队。

行业痛点与解决方案

1. 核心痛点:大模型在企业级数仓跨表查询迷路(字段歧义、自定义算子无法翻译)、响应延迟激增。

2. 技术方案:构建语义层(如FineChatBI对话管理层)分离意图理解与计算引擎,用规则引擎规范逻辑。

3. 服务升级:从数据看板可视化转向DataAgent工作流革新(如SwiftAgent支持智能体协作)。

4. 竞争焦点:攻克大模型幻觉实现分析安全可控,推动服务从订阅制转向结果付费模式。

平台运营与风向

1. 平台需求:企业需要支持原子化部署的BI服务(如FineChatBI入驻云平台),实现Agent协同调度。

2. 最新实践:网易数科聚合多部门Agent产品,提供一站式企业级智能体服务。

3. 招商风向:争夺early adopter客户(如教培、茶饮等数据容错率高行业),建立标杆案例。

4. 风控要点:需预判基座模型升级带来的“偷家”风险,通过指标中台构建竞争壁垒。

产业动向与模式创新

1. 范式变革:BI从IT响应走向深度分析,推动企业从“烟囱式开发”转向标准化语义层。

2. 技术边界:大模型擅长意图理解、任务规划,但需指标平台兜底定性分析(如9.11>9.9逻辑修正)。

3. 组织启示:数势科技“水涨船高”产品架构、网易数帆“9个月变化”战略,体现敏捷应对技术迭代的方法论。

4. 政策启示:企业级数据分析涉及权限管理、统计口径标准化,需推动行业级指标治理体系建设。

{{loading ? '正在重新生成' : '重新生成'}}

返回默认

我是 品牌商 卖家 工厂 服务商 平台商 研究者 帮我再读一遍。

新一代BI如何突围?

文丨胡镤心

编辑丨张睿

【亿邦原创】当行业发展正面撞上技术变革,当你成为那个被平权、被颠覆、被当作靶子的对象时,你该做什么?这是不少SaaS公司在大模型时代的体会。

有服务商告诉我们,ChatGPT发布后的那个春节,不少客户打电话取消订单,甚至有客户好心建议他们改行。DeepSeekR1爆火后,许多企业IT团队纷纷套壳大模型自建应用。“二月份大家好像陷入了狂热,很多企业觉得自己可以靠DeepSeek颠覆一切。”数势科技联创谭李回顾。

这种冲击感在BI行业更为常见。“说起大模型颠覆,第一个想到的是数据库,第二个就是BI。”帆软FineChatBI产品负责人翁林君表示。

由于大模型在分析数据、处理数据上的优异表现,曾经作为企业数据“大脑”的BI,如今成了被平权的对象:从通过SQL、OLAP来分析数据,到通过图标拖拉拽来分析数据,再到通过自然语言对话来分析数据,BI的使用门槛直线降低。数据使用范式也随之改变:Agent将数据分析从被动调用变成实时推送,企业内部从“人找数”变成“数找人”。

BI(商业智能)行业也正在从传统的从“以报表为核心的IT响应”,到“以宽表为核心的自助可视化”,再到“以指标为核心的深度分析”转型。在产品架构、用户体验和业务逻辑的多重变革下,BI企业也在努力自救——预判大模型能力边界,加速融合AI能力,努力提升易用性和服务范围。

AI是否能跳过所有GUI和中间件环节,直接准确地调用数据库?自称Agent的BI应用,是现有流程的加强还是重构?手握know-how、数据且反应快速的老玩家和深谙大模型能力的新玩家同台竞技,谁能暂时领先?

01

“大模型去数仓里捞数,结果迷路了。”

DeepSeek发布那一周,谭李收到不止一个客户提出要自建ChatBI的电话,“有客户跟我说,他今天用了一个开源的ChatBI框架,现在DeepSeek大模型又开源可用,感觉我们的产品效果,他自己也能做出来。”

这类要求他不陌生,ChatGPT发布之后,自建系统的客户数一度高涨,还有企业在内部自研ChatBI,每三个月找他咨询一次技术难题。

谭李曾在百度与京东从事数据分析业务,早年也曾在咨询公司服务500强企业。在他的职业生涯中,ChatBI不是个陌生产品。

过去,企业调用数据的流程并不快捷,也很难实时——当管理者或业务人员使用数据时,需先把需求提给数据分析师,数据分析师把需求反馈给数据产品经理或数据工程师,数据工程师用SQL或者自动化工具调取数据,形成数据集后推送至BI可视化软件,分析师利用BI可视化软件配置各种形态的报表,呈现给业务人员和管理者。如此复杂的长流程,大多只能服务于企业管理层。

如今,大模型让这一复杂冗长的数据消费链路有了优化的可能。大模型的对话能力解决了BI调用难的问题,大模型的分析能力解决了BI数据报表多,指标散落难查找的问题。AI加持下的BI业务,从传统的定义业务——拆解数据分析思路——获取数据——数据加工——数据分析与可视化,直接简化为:上传数据——提出问题——获得分析结果。

也就是说,对于AI-Native的BI公司来说,企业的数据分析流程,从曾经的数据分析师、数据产品经理、数据工程师之间的接力,变成一个Agent搞定全过程。

图片来源:数势科技

但事实真能如此顺利吗?

过去两年实践中,不少企业发现,ChatBI在C端服务场景相对有效,因为数据量有限,容错率高,分析难度低。比如在教培行业,老师上传成绩单,AI自动分析,可以直接形成针对每个学生的成绩分析和学习建议。

但是在B端场景,尤其是高频使用BI的大型企业内部,由于业务体系庞大,多层级、多业务板块之间存在数据壁垒、统计口径混乱,大模型跨表查询准确率仅60%-70%,且企业内部存在自定义的算子、UDF等,大模型无法翻译,生成SQL存在缺失。

谭李分析道,“企业级数据分析,不是丢一个Excel或一本白皮书进去,就可以形成答案。”

首先,企业级数据的规模超出当下大模型产品索引的极限。标准的企业级场景,包含上千GB甚至PB数据,直接套壳大模型去做数据查询和加工,会导致响应延迟激增。

其次,大模型幻觉不仅出现在语义识别上,还出现在分析逻辑上。前者主要表现为字段歧义问题(如“销售额”在不同场景的定义差异),跨表关联、财务指标(如应收周转率)等复杂场景准确率骤降。后者表现在“9.11>9.9”等问题上,需人工修正。

更重要的是,企业级BI面临数据安全、数据权限等硬性要求。大模型无法确定提问人对企业数据的权限范围,直接to SQL容易出现数据安全风险。

“简单说,就是大模型去到任何一个企业级数仓里面捞数的时候,它迷路了。”谭李解释。

对于客户企业提出自建ChatBI的想法,谭李的回复通常都是:“那你先试试?”结果往往是,客户的技术团队还在努力,业务团队先受不了。“据我们观察,业务对技术的耐心一般也就半年到一年。时不时有客户的业务部门被技术折磨得不行了,直接找我们解决问题。”谭李总结。

面对ChatBI的折戟,谭李也一点不感到意外,“大家要对企业级产品充满敬畏之心,企业级产品真的很难,不是套个壳就行。”

02

BI新解法:给大模型建“路标”

对深耕数据分析行业的服务商来说,当下的AI赋能,还是在原有业务流程上的增强版。

从实践来看,过去两年,大模型给数据分析带来的增效主要体现在:

· 前端,通过大模型的意图理解能力,降低BI使用门槛——效果成熟。

· 后端,基于大模型的生成能力,加强数据呈现与分析结果的可视化生成——效果良好。

· 中间,通过大模型的推理能力,尝试生成指标与语义——今年新尝试。

大模型成为BI的交互入口,后端仍然是BI的计算引擎和权限体系。AI主要用于意图识别和条件判断,BI的规则引擎规范计算逻辑,BI的行列级权限控制,确保数据集自动过滤敏感字段(如身份证号、银行账户)。

比如在帆软的FineChatBI技术架构中,大模型处于“对话管理层”,用于支持对话引擎的意图分类、意图理解、思路拆解及上下文管理等能力。而FineChatBI的能力底座,依旧是数据连接、建模计算、搭建渲染、权限管理等BI需要具备的基础能力

图片来源:帆软

为了让大模型在数仓不迷路,过去两年,服务商们相继通过“指标平台”这一产品,将自然语言映射到预定义的业务逻辑,解决自然语言到SQL的准确度问题。

指标平台预设数据指标的定义与管理,避免业务理解对不齐,还具备权限管理能力,实现数据查询的安全可控。

图片来源:帆软指标体系框架

简言之,当下的数据分析路径是:NLP到指标、指标到SQL,SQL到数仓,数仓到数据明细表,由此实现自然语言到分析数据的全过程。

比如数势科技早在2020年就推出数据指标“管研用”一体化平台SwiftMetrics,通过0代码构建标准化的原子指标、派生指标和衍生指标,完成企业级数据-业务语义的统一。通过SwiftMetrics,业务人员不用学习SQL就能自助取数,同时统一指标口径,解决跨部门、跨系统指标口径混乱问题,或进一步推动企业从“数据消费”向“智能体协作”的范式跃迁。谭李强调:“我们做的并不是‘数据看板可视化’这类产品,而是数据智能,更注重DataAgent的应用及企业数据工作流范式的革新。”

2023年,网易数帆也推出指标中台EasyMetrics,作为数据中台与业务应用之间的统一语义层,通过构建跨数据源的统一逻辑语义模型层,实现指标的标准化定义、开发与治理。EasyMetrics的构建与升级,构建了覆盖“定义-开发-治理-应用”全链路的指标体系,打破数据治理中“性能-灵活性-成本”的不可能三角,推动企业数据应用从“烟囱式开发”向标准化语义层转型。

尽管当下BI+AI还停留在对现有BI流程的扩展与增强中,厂商们也并不避讳基座模型升级带来的威胁——当前基座模型能力尚不足以解决NL2SQL的准确性,但基座模型的每一次升级,依然会带来被“偷家”的威胁。

BI公司不得不反复思考:如何让组织跟上技术发展,如何让产品能力随着大模型“水涨船高”。

网易数帆总经理封雷公开表示:“我们战略方向从原来的‘数据软件服务提供商’调整为‘做数据应用价值的赋能者。

封雷介绍,2024年,网易数帆开启“9个月变化”,产品层从数据治理走向数据赋能,加强数据指标制定、数据业务标注、底层数据血缘关联等等工作。在服务流程层,在原先产品交付的基础上,向前一步,加持业务经营。在组织架构上,具备既懂数据又懂业务的人才团队,甚至是面向前端多个不同的业务线,需要具备不同业务环节know-how能力的人才梯队。

谭李更是在产品构建伊始反复强调,产品规则和业务流程的搭建必须符合“水涨船高”的要求。数势科技通过原子化的产品架构,实现业务流程与大模型调用的灵活组合,这一产品思路背后是对模型能力边界的清楚预判。谭李认为,意图理解、规划复杂任务、生成报告与图标,都是模型擅长的,而定性分析是模型不擅长的,只能通过指标中台和企业级语义层来完成。“数据分析的天花板能冲多高,这是大模型决定的,我们要跟着大模型一起往上走。但兜底的活儿由我们来干,不能让大模型来兜底。”

03

Data Agent落地,BI能否拿到AI预算?

在企服行业的共识中,未来每个员工身边都会有一个Agent助理,Agent助理背后,则有成百上千个功能各异的Agent供调度,Data Agent是其中之一,负责数据分析职能。

个人Agent助理是B端的流量入口,也是当前企服公司必争之地,OA企业是这一入口级Agent的最强有力竞争者,BI公司也想成为最靠近员工的Agent。

今年正好成为Data Agent大规模落地元年。

以DeepSeek R1为代表的深度思考模型,将数据分析能力从分析师手中扩展到业务人员手中。

Agent这一产品形态的发展,则让BI能力从被动调用变成主动推送。“从人找数,变成数找人。这是我们说的新一代的智能分析范式。”谭李总结称,“今后的数据分析形态,会是在企业层面上面有一个超级数据智能体能够access到被企业授权的所有数据,包括结构化和非结构化数据,然后以个性化场景化的方式为企业每一个人员提供服务。”

比如霸王茶姬有数千家门店,以前每个店长要自己刷看板,分析经营状况,现在BI可以主动推送数据,在闭店后几分钟内,把当天的营业报告推给店长,同时告诉他对比去年同期、环比前一天表现如何,对比该商圈表现是怎样,别人比你好在哪,你比别人好在哪等等。

数势科技的SwiftAgent、帆软的FineChatBI,均以原子化的方式部署到阿里云等各大云平台上,成为Agent大军中的一员。而网易数智也将网易有数、网易云商等不同部门的Agent产品聚集在同一平台,为企业提供功能齐全的Agent协同服务。

相比于技术变革趋势,客户需求,尤其是客户的AI预算对企服公司来说更为致命。

过去三个月,亿邦动力接触不少品牌企业,热衷于探讨各种AI应用场景与落地方式,但一聊到预算环节,往往卡壳,话题戛然而止。

面对行业预算普遍不足的情况,找到early adopter(早期采用者)成为精细运营的核心。比如,寻找竞争性行业中的竞争性企业;比如寻找热衷于使用新技术栈的技术团队;再比如,寻找有互联网背景或者喜欢混迹于各类技术论坛的技术成员,这些early adopter企业中的early adopter部门和个人,都是BI公司的核心用户画像

可以看到,在复杂的B端场景,SaaS厂商不仅面临技术迭代、产品创新上的加速度,和AI Native创业者掰手腕,更面临着服务商之间的相互跨界和重新划分地盘。

竞争的焦点在于:谁率先跑通“AI+场景+数据”的链路闭环;谁先克服大模型幻觉,实现最后一公里的安全可控;谁能率先将企业服务从被动调用变成主动提供,从订阅付费变成结果付费。

起步阶段,BI公司基于行业Know-how与敏捷反应取得短暂领先,但随着模型升级与服务商相互攻伐,没有人可以稳坐高台。BI公司经历的这一变革,几乎是这个时代每个SaaS公司的缩影。

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0