广告
加载中

“独角兽”云智慧的持续进化方法论

宇婷 2021/10/22 17:08

今年7月,智能运维公司云智慧完成E轮融资1.5亿美元。其中,仅以红杉资本为例,七轮追投使云智慧成为其历史上被追投次数最多的公司之一。

这家公司也创下国内智能运维行业的最高融资纪录,1500人的团队也使其成为国内运维领域最大规模的企业。

根据市场研究咨询公司MarketsandMarkets估计,全球智能运维市场的规模预计在2023年达到110.2亿美元,年均复合增长率高达34%。北美IT采购预算中15%-20%在运维上。对比我国目前的比例仅为2%-5%。未来市场空间充满想象力。

市场空间巨大,并成为国内TO B新晋独角兽,走到这一阶段的云智慧又会面临怎样的新挑战呢?

目前,云智慧在服务客户过程中抽离出两个共性:一是客户需求非常多,二是客户发展路径不同。发展阶段、行业和技术门类、不同企业的进化速度带来了挑战。

TO B的价值在于做客户需要的东西,客户的需求和厂商分析出来的需求是两回事。很多时候,客户并不知道自己需要的是什么。另外一些时候,大型甲方客户又比创业公司想的深远,引领客户很难。

就在几个月前,云智慧团队意识到,现在智能运维行业碰到了一个难题,那就是当与客户探讨智能运维时,到底该做成什么样子,没有一个统一的话语体系。他们联想到自动驾驶的分级,觉得智能运维和此很像,也可以分成从Level0到Level5。

“这事儿就应该这么干!”在采访中,云智慧总裁刘洪涛告诉TO B新势力。云智慧团队快速决定,希望通过这个动作,在未来一年半的时间里,搭建一个行业的共同话语体系。

今年9月下旬,云智慧召开媒体沟通会,正式发布“智能运维分级成熟度模型”。

智能运维主要关注三点:业务效能、用户体验、IT自动化。他们调研了金融保险、运营商,制造等十几个行业。从数千家客户中随机选出268家客户。几个月的时间里,在智能运维国标编制组的指导下,借鉴ITSS运维服务能力成熟度模型,以及Gartner发布的AIOps指南,归纳出六个阶段和五个提升过程。

云智慧希望通过这件事起到的作用是,首先,让客户可以便捷地找到自身运维属于哪个阶段。其次,提出发展的方向,以及需要做的动作。客户能够在实践过程中清晰看到运维的意义,也不用完全依赖于咨询公司的咨询规划。

AI是解决当下动辄上万台服务器检测的出路,云智慧认为未来的方向一定是智能化的运维。智能运维的分级与自动驾驶分级模型类似。从L0都是纯人工的,没有任何工具和辅助手段的种驾驶,到L5理想化完全无需人工。

这个话语体系有三个意味。为运维专业人士提供简洁清晰的参照;带动行业认知,让更多友商参与;推动非IT人士懂运维。云智慧的出发点是,这个分级成熟度模型不属于一家公司,而是建立行业共同的话语体系。

为什么这个分级模型值得信任?云智慧总裁刘洪涛也在媒体交流会上阐述了三点:一是云智慧历经多年发展已经积累大量客户,具备丰富可供参考的实战经验;二是云智慧能提供完整的全栈解决方案,因此有完整视角;三是要有足够的技术水平。

据了解,云智慧目前主要服务的客户是中国TOP3000的大型企业单位和政府。大部分客户处于L1和L2级别。中高端客户已经进行了初步的智能化实践。一部分高端客户,比如金融、保险公司处于L4级别。

1、「吹牛」,再用拿下的市场验证「吹牛」

“吹牛,用做到验证吹牛。反复验证,靠市场验证。”刘洪涛向TO B新势力叙说了他们的实践方法。

2016年春天的一个周末,云智慧的管理团队和核心骨干十几个人,在香山开战略务虚会。当时公司规模还不大,就在会上,一位销售VP接到电话通知——因为竞争对手的低价策略,一家大客户被抢走了。

这有点违反TO B行业规律。

甲方是大客户,如若他们重视产品和服务的质量,那么价格,相对于最终交付质量并非决定性因素。

那大客户为什么会走掉?

原因只有一条——在甲方心里这几个产品价值不够高,谁来提供,或者交付结果如何,甲方并没有那么看重。这也说明在当时,云智慧所在的APM领域,是一个红海市场。

2009年,云智慧用SaaS的模式做运维切入市场。创业开始,他们看好SaaS,直到现在也坚定认为SaaS是未来。但是在成长过程中,云智慧团队意识到:抓住真正的客户需求是什么,或者最急需满足的客户需求是什么。才能够让一家公司成长,能够让公司获得收益。

2016年这场香山务虚会后,云智慧改变了。

他们发觉全栈运维解决方案比单纯的工具更适合中国市场。运维场景涵盖的工作很多,而且复杂,需要通盘考虑。单一的APM只是一个工具,这适合当时IT成熟度高的美国市场,但中国客户需要能够解决一揽子问题的产品。

“北美市场客户需要的是一个工具类产品,中国市场的客户需要4S店。”刘洪涛打了个比方。

2、TO B不需要特别的长板,但要持续进化

这个转型的难度是非常巨大的。事实上很少有人有重构公司的经验。

2016年到2019年,这三年云智慧重构了公司。除了重新定义产品,改变的还包括研发管理方式、公司经营等。

“整个过程是一个特别大的挑战。提前想好了,但能不能做到,我认为很多人是做不到的。”

“如果说我们并没有哪一项分数足够高,但没有短板,你会不会觉得有点凡尔赛?”谈到主观原因,刘洪涛如上说道。

“TO B公司能够生存和发展最主要的是能力的均衡,营销、产品、技术、融资都要到位。

市场营销能力、服务交付能力、产品研发能力不能有明显的缺陷。”

“现在随着公司的进一步发展,还要加上组织建设能力,财务管理能力,运营协作能力。投资管理能力。”

“撑到今天,不是某一项能力做得好,而是各项能力都比较均衡。不是哪一项达到120分,而是每一项都达到80分。”他很认真地补充。

从外界观察,云智慧特质在于整个管理层的决策速度和灵活度高。云智慧的创始人团队风格是自我加压的风格。他们对自己要求很高,所以反而资方多轮加持,但团队本身并不感到压力。

“我们要做成什么样的公司,在多长时间把自己做到什么程度,能不能跟得上行业发展,战略规划能不能实现?”刘洪涛告诉TO B新势力这是他们经常质问自己的问题。

刘洪涛认为管理层的视野和素质是基础。方向感一直是次因。底层要围绕的中心是——客户。

3、让运维这件事,从“土”到很“创新”

今年初,云智慧请来一位全新的COO加入,建立整个公司的全新流程。

从350人,再到一年之间从750人涨到1500人,销售和研发团队扩张。这种管理布局也体现了云智慧进化的公司特质。流程建设要花费巨大成本。显然他们在为未来的3-5年,甚至更长远准备。

千人之后,云智慧的变化体现在两点,一是企业文化建设提上日程。其次是管理体系建设。

“文化是大家做事的共同标准。体系让售前、产品等流程串起来。”刘洪涛说。云智慧按照两年后涨到数千人的标准做培训,建设管理团队。这是为了让公司今后可以靠系统和流程自驱动,而不是靠人。采访时,我感到这和云智慧提倡的智能运维在底层是一样的逻辑。

IT建设更多是集中的,而运维则是漫长的。在长时间的过程中,运维能够提高效率,节省人力会产生更大的价值。

很久很久以前,运维场景被认为很土,但现在转为性感。一方面,AI和算法在智能运维上的价值体现明显,从0到1,每一步的创新都给从业者很大的价值感。另一方面,运维场景的通用性很可能在这个领域中产生全球化的公司。比如,云智慧已经在新加坡、东南亚设点并产生营收。

中国科技的复杂和市场需求,在帮助这一代TO B创业公司抓住更好地打磨产品的机会,面向全球推出适配的产品成为可能。

“我们是真的有机会做一家全球通用软件公司。”刘洪涛告诉TO B新势力。

虽然云智慧已经成为一家独角兽公司,但并没有“特立独行”的气质。刘洪涛觉得如果非要给这家公司冠以某种独特性,那应该是——持续进化。“不管内外,不管销售还是产品,不管技术和管理,永远不能停下来。”

2016年的这次转型已经看出云智慧的进化基因。

在云智慧管理团队看来,不断复盘是必须的,遇到挑战——学习——解决——深入思考。想到自己之前做的某件事有点犯傻,恰恰证明了进步。

到底是时代催生独角兽?还是进化让自身成为独角兽?我问了刘洪涛2016年让他们决定战略转型丢失的那个客户后来找回没有。

“纠结没有意义,没有必要纠结个案,我们已经用现在更多的客户,证明当时的做法是对的。在不同的成长阶段,给别人给行业信心,持续变化很重要。”他说。

TO B方法论:拆解智能运维分级成熟度模型

本部分内容总结自云智慧媒体沟通会

L0阶段是人工运维阶段。人类要面对非常复杂的IT或者是系统,实际上在数字化世界,运维负担都非常大。另外现在人力成本也越来越高,所以它的痛点主要是对这些设备、系统、指标没法进行监控和告警,运维非常困难。L0阶段客户处于救火状态,而且经常一人多职,比如说一个工程师可能要解决很多问题。在感受层面,不知道什么时候可以修复,不知道找谁修复。在流程方面是无追溯、无审计、无组织机构,所以整个运维过程是比较混乱和分散的,在数据层面是没有数据治理的这种概念。

L1阶段,从人力运维到辅助运维,主要的提升手段是构建监控工具或补全监控工具。主要的特征在于,在辅助运维的层面服务经常中断,能够找到决策者,但是不知道什么时候能够恢复故障。有一些纸质的记录,但是没有系统的归档。在数据层面客户没有比较好的管控工具。

客户在L1阶段,最重要的一些问题就是,需要构建比较基础的一些工具,补全一些工具。目前市面客户的诉求比较大的是比如说环境动力(机房层面的),也有比如说混合的这种云环境,还有就是监控网络质量(内网外网的网络质量),监控日志或者监控一些基础设施,以及相应的数据库中间件、大数据组件、监控应用软件或者是用户体验层面,客户需要改进的策略等。

L2阶段,整合阶段。在L2阶段强调的是客户体验层面偶尔中断,但是这个系统可以找到相应的人去管理,服务质量是有大幅提升,同时具备了一些初步的工具,比如有度量、规范、平台、考核等等。在工具层面,客户主要引用的是监控工具的整合。第二就是有这种自动告警或告警的准则。第三块就是服务管理和服务管理流程体系的建立,服务资产及配置管理的建立以及运维可视化。当然还有重要的一点就是自动化工具,也是客户非常关注的。

基于L2级别,客户可以有小于一小时的应用故障的恢复时长。如果说一个客户处于L1级别,可能缺乏规划所以不能提升,向L2级别迈进的话,他要做哪些事儿呢?在组织架构、岗位设置、管理制度、流程、考核指标、运维工具的整合等等方面要做很多工作,要把相应的工作全部串接起来。

L3阶段,实际上已经是涉及数据了,因为运维数据是非常多,复杂且分散的,而且智能运维现在关注的是业务交易数据、运营数据和IT本身的一系列的数据和指标。在打通层面,L3在用户体验层面主要体现在业务效率的提升和用户体验的明显改善,以及可管理的一些自助服务,比如说用它的服务台构建自助服务。

在措施层面,主要集中在服务资产与业务可视化方面,状态可视、运维可管、安全可控,这几个层面会一并努力。L3水平一般都是在做数据治理以及场景化的输出。运维数据包含:交易的数据、应用程序的数据、技术架构的数据、网络数据、用户数据、安全数据或者预测数据,边缘计算以及其他数据等等。

L4级别,高度智能化,需要涉及大量的算法模型的建立和预测。L4主要关注点是在于业务的持续洞察和业务运维活动的可决策。通过使用一些工具,比如在算法层面做一些算法库,算法库同时对客户的数据进行了算法泛型规范化。这样一个数据就知道它的泛型,可以直接指定算法,然后输出需要的一些场景。在数据管理层面的消费场景已经非常丰富,预测能力大大提升,在L4级别可以达到秒级的故障恢复。

L5阶段,人工智能最高阶段,也是现在智能运维定义的最高阶段,它的关键词叫自治,实际上是对服务的中断、切换或升级和扩容均无感知,就跟用电一样。对物理世界、应用交易、系统都没有什么感知,让人可以去做很多有意义的事情。通过什么手段来做?

手段一:流程挖掘;手段二:超自动化,就是RPA技术,现在RPA技术也应用到非常多的领域;手段三:人工智能化或者AI化,就是人工智能可以训练人工智能,它主要能达到的效果是可以进行毫秒级的处置,引流导流与业务导流,保持应用不会中断。

注:文/宇婷,文章来源:宇婷对话TO,本文为作者独立观点,不代表亿邦动力立场。

文章来源:宇婷对话TO

广告
微信
朋友圈
收藏 +1
点赞 +1
评论
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0