广告
加载中

李丰对话季宇:理解英伟达 解构英伟达 挑战英伟达

李丰 季宇 2024/07/01 08:30

在全球科技的舞台上,英伟达无疑是一颗耀眼的明星。过去半个月,英伟达一度坐上美股市值第一的宝座,却又在之后经历了连续三日的下跌,如此起起落落的行情引发了市场的广泛关注。

虽然市面上关于英伟达和AI芯片的讨论热度不减,但是大家对未来趋势的看法却有不同看法。不久前,丰叔与行云集成电路的创始人兼CEO季宇博士就英伟达的垄断地位、AI芯片创业的机遇和挑战,以及技术创业的热潮与泡沫等话题展开了深入的探讨。

季宇博士拥有清华物理系本科和清华计算机系体系结构方向博士学位,在顶刊与会议发表论文数十篇,是中国计算机学会CCF优博奖获得者。博士毕业后,他入选“华为天才少年”计划,在华为海思昇腾担任编译器架构师,负责多个前沿项目的研发。他也活跃于知乎平台,是知名的知乎答主mackler。2023年,季宇开始自己的AI芯片创业之旅,用通俗的话来讲,他希望用英伟达的方式,来解构和抗衡英伟达。

/01/

警惕陷入具体的技术细节中,

而忽视技术发展的底层逻辑

李丰:季宇是通过物理竞赛保送进的清华,物理应该是最难学的专业之一了。你当时在清华念书是什么样的状态?

季宇:当时我的本科同学大概分为两种:一种是竞赛保送;一种就是高考进来的学霸。这两类人特征非常鲜明。后者进校后学习仍然非常认真,成绩也非常好;前者则“浪”一些,成绩也许并不拔尖,但喜欢天天琢磨各种问题。

李丰:你应该是前者。

季宇:对。

李丰:清华物理系出国机会很多。你选择了留在国内,毕业后加入华为,是出于什么考虑?

季宇:从物理系本科毕业后,我去了计算机系。高中因为接触面有限,高考选专业会倾向于选择自己喜欢的方向。

但进入大学后,我逐渐意识到继续走物理这条路,未来可能并没有太多大的机会。当前大家关注比较多的,比如凝聚态或者高能等物理的前沿方向,其推进往往需要很庞大的团队,这和我先前的设想有一些偏差,所以本科毕业后我就换到了计算机方向。

计算机和物理是两个很典型的行业,代表了两个极端。物理是从纷繁的现实世界中抽象出最简洁的规律,而计算机则是从最简洁的规律出发去创造一套纷繁的算法。两种学科背景让我获得了交叉视角。行业里,大家的思维很容易陷入具体的技术细节中,会忽视技术背后的发展脉络,以及一些底层逻辑。相较之下,我接受的物理学训练让我得以洞察到计算机这个非常工程化的行业的底层规律。

我在博士阶段做了很多有关类脑计算的研究。毕业后,我加入华为海思,做的就是AI芯片相关的工作,具体做的是软件编译器,希望通过软件编译器的方式来解决软件生态问题。大模型出来后,我在自己的知乎专栏(ID:Mackler)也写了很多分析文章,比如从最顶层的需求解剖,从软件、算法到芯片层面的分析,以及国产芯片的破局方法等等。

2023年,我出来创业,也是想在这个时间节点,探索一种真正意义上既符合市场化规律,又能满足计算机行业发展规律的方式,逐步解构被英伟达垄断的高端AI芯片市场。

/02/

无论是人脑还是大模型,

无法解释的部分主要源于微观层面的不可测

李丰:你的研究方向是类脑计算。我一直有一个好奇。当前,人们对于算法演进的路径还不能完全归因,对于人类大脑是如何处理、记忆和翻译各式信息的理解也同样不足。如果我们把这两种智能比作两个树杈,二者最终会指向完全不同的方向么?

季宇:我倾向于认为,大脑是一个非常复杂的系统,单纯从神经元角度出发,很难解释清楚一个如此庞大复杂的系统是如何建构起来的。这当然是因为我们对大脑的认知还不够全,很难用一个简单的方式解释清楚其工作原理。

同样,虽然大模型是被人类设计出来的,但人们目前也很难完全解释清楚大模型是如何达到当前的效果的。我们可以尝试粗略地去理解,大模型的能力是好几层能力的叠加:一层是具备很强计算能力的计算机;深度学习是另一层,是计算机模仿人脑学习的方法,其工作原理与人脑神经网络运行的原理类似;语言模型又进一步提供了支撑能力。每一层都是上一层的基座。

当然,在我看来,人脑的复杂性要远高过深度学习,深度学习的复杂性又高于计算机。总体而言,无论是大模型还是人脑,都很难通过简单的原理解释清楚。

李丰:所以你认为二者都具有不可知的部分。

季宇:更准确的说法应该是不可测。“More is different”,多者异也。

举个简单例子,在宏观层面,我们可以测量一团气体的温度、体积、压强,但进入微观层面,这些概念都是不存在的。气体内部实际上是一堆不计其数的小分子在做非常复杂的运动。只要这一体系足够庞大、复杂度足以达到某个当量时,就会呈现出温度、体积、压强这类宏观概念。人脑和大模型也是类似的道理。宏观层面,我们能看到很多神奇的能力,但在微观层面是不可测的。

所以,虽然今天的大模型有各种各样的问题,但并不是说我们就要另起炉灶,颠覆式地搞一套别的算法。当前大模型有各种各样的问题,很可能是因为它的复杂度还没有高到一个特定的层级。在大模型发展的过程中,当它的某些维度变得越来越大,人们可能会设计出一些新方法来管理和解决这些问题,进而出现一个基于当前的大模型,但又能比今日的大模型能解决更多问题,具有更多人脑特质的智慧形态。

/03/

英伟达的股价过热了吗?

李丰:最近大家讨论最多的三家公司是英伟达、微软、苹果。过去一个月里,三家几乎是轮流坐上了美股市值第一的宝座。你觉得英伟达的股价有没有泡沫?

季宇:主要有两方面因素支撑着英伟达的股价:一是大模型产业的发展,二是英伟达在大模型产业中的垄断地位。

当然,大模型产业本身是有一些泡沫的,但是考虑到英伟达的垄断性,我觉得它的股价没有泡沫。支撑英伟达股价的底层逻辑是,除非出现一些真正的破局者来搅动市场,否则英伟达大概率仍将保持垄断地位。

李丰:英伟达在AI芯片领域独占鳌头,历史上也有一些可类比的企业,比如个人电脑发展最快的时代有英特尔,无线通讯发展最快的年代对应的是高通。但是无论是英特尔还是高通,二者的市值从未出现过对其他芯片企业如此高倍数的碾压。

可能更为接近的是英特尔。从IBM的兼容机起,英特尔奠定了行业最底层“砖瓦”的角色,无论是软件还是操作系统,大家都是围绕英特尔这套东西搭建的。能达到这个境界,不单纯是因为英特尔CPU的性能做到了无出其右,而是因为它成为了行业标准,这个垄断效力是非常强的。

当年,英特尔有一件事情做得比较特别,让人印象深刻,就是它推出“Intel Inside”的营销方案,只要OEM合作伙伴在广告和电脑上加上英特尔的LOGO,就可以在购买英特尔芯片中计提广告费用。虽然Intel是一个不容易被看见的ToB品牌,但是既有强大的技术做支撑,又有成功的营销方案占领消费者认知,英特尔得以强化它在PC端的占有率和领导力。即便到今日,这份垄断也依然支撑着英特尔在计算产业中占据重要地位。

我很好奇,你怎么看待英伟达是如何走到今天的垄断地位?

季宇:英伟达是从3D图形加速处理器领域切入的。上世纪90年代,这个领域的需求上涨,英伟达的3D图形加速处理器作为扩展卡,因为可以与英特尔的体系兼容,成功保住了独立显卡的生态位,避免了被英特尔集成。

1999年,英伟达推出了划时代的产品——GeForce 256显卡,这是第一款采用“GPU”概念的产品。此后,英伟达开始布局扩大生态,希望把它在3D图形加速这块取得独立生态位的GPU产品推广到通用计算领域,以一个不同的形态与CPU竞争。可以说英伟达花了近十年来布局。虽然这段时间它没有取得太多进展,但确实把需要做的各项准备都做好了。

直到2012年,深度学习领域取得重大进步,英伟达得以通过AI切入到计算产业里非常重要的位置。此外,随着深度学习产业本身重要性的发展,英伟达逐步成为数据中心里非常强大的存在。

李丰:非芯片相关行业的人可能会很好奇,英伟达从3D图形加速处理器领域切入,为什么在适应人工智能方面有得天独厚的优势地位?

季宇:硬件和算法是相互作用的关系。首先,硬件会影响算法的发展,也就是说,你有一个更好的硬件,那么算法有可能会朝着更适合这个硬件的方式去发展。

总体来讲,3D图形加速跟今天的AI都非常依赖高算力。当英伟达做完3D图形加速处理器之后,它意识到这么高的算力一定能在别的领域发挥作用,所以,它把算力做了通用化。

那么,到底什么样的产业能支撑这么高的算力?英伟达做了很多赌注,它押注了像超级计算、物理仿真等很多领域,当然也包括AI。最终,AI在它的推动下得到了高速的发展。

/04/

对抗行业惯性的策略:

主动加入惯性,成为惯性的一部分

李丰:AI在中国的投资热大约是从2014年后开始,那一波主要在自动驾驶、安防、语音识别等领域。既然那时人工智能已经开始展现出潜力,并且英伟达已经开始一马当先了,为什么在那个阶段,包括英特尔这些做底层芯片架构的大公司没能在此后的5到 10年里追上它呢?

季宇:一旦谈到“追赶”,可能更多是从技术层面考虑,要怎么去做一个今天人工智能需要的、在算力等维度能做到相应水准的芯片。但我对此有不同的看法。

从计算机发展史来看,1981年IBM兼容机的出现是一个重要的分水岭。在兼容机出现前,计算机行业是垂直一体化模式,IBM做一套系统,DEC(即美国数字设备公司,英文:Digital Equipment Corporation)做一套系统。

在这个阶段,对终端消费者或者下游行业客户来说,谁家那套产品更能满足我的需求,我就用谁家的。

兼容机出现后,计算机行业快速转向了水平分层架构。相当于微软专注于操作系统,英特尔专注做CPU,软件公司侧重于软件。这种水平分层架构形成的一整套垂直技术栈,比任何一家公司单打独斗做出来的产品更具竞争力,所以很快淘汰了行业过去的垂直一体化模式。

这种水平分层架构也给行业带来了深远影响,计算机行业的大的结构开始进入一个非常稳定的状态,不管将来市场的需求如何变化,都很难随随便便就把中间的某一层给替换掉,因为这种替换会给这一层的上下游都带来非常剧烈的影响。比如要把Intel x86换掉,可能微软过去的所有历史积累全部都得扔掉;要换掉微软,英特尔以及上层应用的所有系列也都得换掉。

结果就是计算机行业的惯性变得非常大。初出茅庐的英伟达对抗这种惯性的策略是,主动加入到惯性中,成为惯性的一部分。

同样的道理,今时今日,当AI的各种应用兴起,英伟达已经成为大家默认的主流产品,这个时候你想要简单粗暴地替换它,是很困难的,因为这并非只是在技术方面的角逐。行业不会说,今天英伟达的算力强一点,我就买英伟达,明天英特尔强一点,我就买英特尔,在二者之间来回摇摆。在行业惯性已经非常大的背景下,市场支持的更替周期会非常缓慢和漫长。

正是因为如此,无论是英特尔,还是其他芯片公司,大家要考虑的并非仅仅是如何在算力上完成追赶,这只是一个基础条件,更重要的是想明白,要如何去克服惯性。

李丰:英伟达的CUDA系统对它当前的行业地位起到了多大作用?

季宇:作用至关重要。正是CUDA让英伟达的垄断地位延续下去。很多人容易陷入思维惯性,认为创业公司要破局,要么是追赶,要么是通过不同的技术路径去超越,但无论是追赶还是超越,本质上都是希望去替代前者。然而,在当前横向分层的计算机行业的惯性已经非常大的情况下,替代这件事几乎不会发生。

/05/

系统的惯性再大,也不会停止演化,

演化就有新陈代谢的机会

李丰:既然如此,你出来创业是看到了什么机会?

季宇:系统的惯性再大,也不会停止演化,只要演化,就有新陈代谢的机会。市场不会排斥在保持系统结构不变的情况下提升部分指标。英伟达也是如此,因为大家有提升算力的需求,有更强的互联需求,GPU就把握住了机会,找到了属于它的切口。

需要强调的是,这个新陈代谢并不是必然发生的,它可能不是大势所趋,而是事在人为。

在整个行业默认的惯性下,会有一些需求的变化,这种变化会带来一些机会去改造计算机到底应该长什么样。比如说,今天的计算机,大家默认是英特尔的或者MD的 X86 CPU对处理器,加上英伟达的GPU,外加一些网卡,或者加上一些NV link通信协议等。但是,未来随着需求的演化,除了既有各水平层的量变之外,有没有可能长出一个新的“器官”,这个是我们可以去设计和牵引的需求。

相较于过去的深度学习,当前的大模型对计算机系统的要求发生了巨大的变化。在这个过程中,我们既可以按照行业惯性去头疼医头,脚疼医脚,哪边需要提升,就提升哪边;我们也可以重新设计,渐进地从今天既有的体系上分裂出一种新的形态,引导计算机系统往全新的形态去发展。这也是英伟达过去能在计算机系统里面争得一席之地的一个重要原因。

/06/

新需求如何被满足,

是改进和解构这两条路线的博弈

李丰:如果作为一个新的不同层面上的需求,大模型会触发“长出新器官”的机会,今天的大模型往后演进,会不会产生英伟达所不能完全适配的需求,又会不会因此而长出一个什么类型的器官呢?英伟达在未来的某个时间节点会不会变成上一个周期里的英特尔?

季宇:有一个问题需要厘清。英伟达当时能入局,并不是因为英特尔没办法支持新需求,或者说系统出现了问题,英特尔不去解决,生生给英伟达让出了一个机会;而是因为GPU这么一个“新器官”本质上是英伟达主动去推动的。

这个新的需求,究竟是通过英特尔渐进式地改进它的CPU去满足,还是别人通过做一个GPU出来更好地满足,本质上是这两条路线在博弈。英伟达的胜利就是因为赢得了这场博弈。

过去英特尔的CPU负责计算机上面的所有事情,英伟达跳出来说,我们的GPU只负责计算,最终它在计算这个维度上性能完全超越了英特尔的CPU,所以这部分任务就被它成功拆解出来了。如今,英伟达的GPU在计算这个维度也变得异常庞大,一颗芯片承担的职责越庞大,越有机会去塑造一个把它解构出来的可能性。

同样,并不是说当前有什么新需求是英伟达无法满足的。它一定会极力提升GPU在各方面的能力,尽可能地满足今天市场的所有需求。我们要思考如何赢得这场改进和解构间的博弈。

在这个背景下,我们出来创业,其实是希望证明,计算机系统可以不只有CPU、GPU,还可以有一个新的协处理器(一种芯片,用于减轻系统微处理器的特定处理任务),这三者组成的新系统要比仅有CPU、GPU的组合更高效。

要实现这个目标,最核心的步骤是对当前GPU负责的任务做解构,哪些归GPU负责,哪些归协处理器负责。

我们当前的解构思路是把计算进一步拆解成算力密集型计算和访存密集型计算。算力密集的部分是英伟达的GPU最擅长的,拆解后可以继续由GPU产品负责,访存密集的部分可以由协处理芯片来负责。

我们并不是说要自己做两颗芯片来打一颗英伟达的芯片,而是用一颗英伟达的最高端的芯片加上我们的一颗补充芯片构成的新组合,来打英伟达最高端的芯片。

这种逻辑一定是我们主动去做的,行业不会自发地往这个方向走。

所谓的“行业自发”其实是大家极力去满足所有能看到的需求,其结果是行业垄断性不断被加强。英伟达不断发布新产品,各方面的性能指标越来越强,统治力越来越全面,但既然英伟达之前能够解构看似无懈可击的英特尔,它的破局方法可能也能被用来解构它。

这背后有个很反直觉的结论在于,一颗芯片越全能,越有可能被解构,但是越不可能被替代。

李丰:正是因为人们对娱乐和媒介的需求越来越复杂,对PC芯片处理图像图形能力的要求越来越高,才为英伟达能作为一个独立角色出现奠定了基础。

那当前,随着人工智能在各种行业的广泛应用,它要处理的信息和需求也越来越多和复杂,英伟达的算力可能也会遇到天花板,紧接着可能大模型应用和相关投资的热度也会随之减退,你会怎么去预判未来的走势呢?

季宇:其实大模型本身的需求已经涵盖了刚才我们讲的各种各样的可能性。与主要吃算力的深度学习相比,今天的大模型吃的东西要更全面,比如它需要很高的显存,很强的互联,当然也要很高的算力。所以,并不存在说未来它要满足的需求越来越丰富,所以它会如何如何变化,大模型本身就是一个巨大的变化。

当然,我们说长出一个“新的器官”的可能,计算机行业不可能大势所趋地自发走向越来越解构的状态,一定是当中有一些有心人,比如说我们,刻意地塑造出一些边界条件,让计算机系统形态有可能往一个我们更希望看到的,也对行业更有利的方向去发展。

如果没有人能够完成这种解构,那行业会继续沿着GPU满足所有需求的惯性继续发展下去。

/07/

计算机到底应该长什么样,

可以重新定义吗?

李丰:你们的协处理器主要希望面对的是哪类大模型的应用场景?

季宇:面向当前所有语言模型的需求,主要是文本生成阶段,因为这个阶段是一个非常典型的memory bound(内存受限的) 的阶段,也就是需要大量内存的阶段。

李丰:可以稍微科普下。

季宇:今天的计算其实有很多种类型,有些非常吃算力,有些可能计算量不是特别大,但需要读很多数据。后面这种是正好对应今天文本生成这个阶段。

当下的情况是,英伟达做的芯片,算力很强,读数据的速度也很快,它能帮你高效地完成前部分任务,做后部分任务也很高效,确实看起来无懈可击。

但如果解构开来,有的芯片专门做算的部分,有的芯片专门做海量数据读取的部分,那么在这个边界下面,负责后面这部分的芯片就可以放弃掉一些东西,可以走得更激进,更高效地满足客户在读取数据方面的需求呢?

李丰:假如当前市场只有互联网巨头在竞争大模型和大模型应用,你讲的这种需求的典型性也同样存在么?创业公司仍然会有市场空间么?

季宇:同样存在,因为这是一个普适的需求,并不是说只针对某一个具体的大模型公司。这个是有业界共识的,只不过说这个业界共识要怎么转化成计算机系统的形态和技术细节。

今天大家都知道要去提升读数据的速度,英伟达也在疯狂提升,只不过说它是算力仍然在提升,但是另外一个维度也在提升。那其他公司可能也在看,OK,我原来可能跟英伟达在竞争算力,我今天可能还要去跟它竞争显存带宽。

我们还是希望在计算机到底应该长什么样这个事情上去塑造一些不一样的形态。

李丰:既然存在共识,会有很多人也看到这个机会,竞争也会比较激烈。当然大家做的体系、架构会有一些各自的不同,那最后谁的产品更容易被采用?

一颗芯片从设计出来,到流片、试用、量产,到真正意义上能被中型以上的企业大规模采用,往往需要比较长的时间,这非常考验芯片设计企业对两三年后市场变化的预判。

我觉得这是这行最有挑战的部分,既是最大的痛苦,也是最大的机会。就看站在今天去赌两三年后的变化,谁能赌准。从你的角度来看,哪些因素可能会影响这些可能路径的成败?

季宇:当前,很多半导体公司还是默认,计算机系统就应该长这样:有一些CPU,有一些GPU,然后通过这样一种形式连在一起,来跑所有水平分层的任务。

这种默认也导致大家争夺的是其中某一设备的市场份额。比如有的人想要争夺GPU的份额,就尝试用TPU或者XPU来替代GPU;有的人觉得当前的互联不够,那就把互联的各项指标做得更强一点。

我们希望去争夺的,是计算机系统的形态可以往一个其他的方向去演进。比如说读数据要读多快这个需求,其实是可以有不同的方式的。

回到20年前,如果对当时的计算机系统的形态全盘接受——一个CPU加上一堆扩展卡,最终无非就是设备的争夺,去争夺CPU那个部分,这在我看来是注定不会成功的,因为你没办法把一个已经存在且很重要的东西直接替代掉。

就像当年英伟达一样,接受英特尔的CPU无可替代,然后在宏观层面通过将计算机系统改造为CPU+GPU的形态,提供比纯CPU系统更高性能的路径,完成了破局。

这种竞争方式其实不是一个常规的半导体的竞争方式。半导体技术本身当然非常重要,但更重要的是你要如何定义计算机系统的形态,这也考验着企业对于系统生态和开发者需求的深层理解。

当然,因为你要在计算机形态中增加一个新的东西,你要知道如何划定这条边界,如何让这条边界和这种组合变得可实现。

所以,这是非常有挑战性的,也意味着很大的机会。

/08/

待大模型泡沫消散,

成本矛盾会更加突出

李丰:人工智能在将来肯定会无处不在。不过,今天的大模型用起来比较贵,因为非常消耗算力,功耗很高。目前大家有一定的共识,今天大模型本身在投资上有一定程度的泡沫。假定这个泡沫在未来两三年中破灭了,或者大家在大模型技术本身方面的争夺告一段落,开始将重点更多地放在把技术推广到应用层面,哪些变量会影响你刚才讲的新架构的出现?

季宇:首先是成本因素。如果大模型泡沫消散的话,成本矛盾会更加突出。我们想要推动计算机系统朝新方向演进的想法,本质上也是为了解决当前已经比较凸显的成本问题。

我们还是举英伟达过去的例子。

此前,并不是说CPU没有图像处理能力,它也有,但是你可能需要买英特尔最高端的处理器才能获得对应的能力。这种最高端的产品是非常昂贵的。

那时的英伟达实则提供了一种可能性:个人玩家买不起那么贵的专业级产品,你可以买一个最廉价的CPU,再组合上一个并不是很贵的英伟达的GPU,也一样可以跑3D游戏。这本质上就是从成本角度出发。

所以,我们要做的事情是相似的。

目前英伟达的机器性能越来越好,但价格也越卖越贵,卡从过去的几万块卖到了几十万,服务器从几百万卖到了几千万。那如果今天我们能把这个需求解构,变成说,OK,你就买一些相对便宜的英伟达的消费级的卡来完成其中一部分的事情,然后再补充我们这些便宜得多的新硬件来负责其他部分,这样的新组合可以大幅降低成本。

其实,今天的计算机产业已经走向了一个有点类似历史上IBM推出大型机的节点,当时IBM的大型机是面向银行所需的高吞吐的数据处理需求来设计的,今天英伟达的“大型机”可能是针对AI训练或推理来设计的。

这种“大型机”的出现本质上对行业发展是不利的,因为互联网产业之前一直都是建立在非常低价的白盒的体系之上。我们希望通过对结构的创新让这个体系的组件能变得更开放、更低价。

/09/

中美竞争,

对在中国做芯片创业起到加速作用

李丰:刚才你谈到了许多对AI芯片创业的思考,那么把在中国做芯片创业这个因素考虑进去,这些思考会有哪些不同?

季宇:其实,当前中美关系的大环境对我们的商业逻辑可以起到加速作用。

李丰:原因是?

季宇:从纯市场角度来讲,考虑到行业惯性,想让大家少用些英伟达的产品,去接受一些新东西,推动这种转变会比较慢。当年英伟达推动大家去买更多的GPU,也是花费了非常长的时间。

今天就大模型产业来讲,降低成本之外,寻求英伟达之外的更安全的供应链也是一个重要驱动。大家倾向于说,我们不是要直接替换掉英伟达,而是希望降低英伟达在这个系统中的重要性。这种氛围是对我们是有利的。

李丰:就是说它分为两层:首先,美国现在对芯片的一些限制措施,已经导致国内企业对于英伟达高端芯片的采购受限。这时候如果能通过一种新的组合,即“能够买得到的英伟达芯片+其他类型的协处理器”,达到与较为高端的英伟达芯片足以匹敌的功效,就会激发相关的市场需求。

其次,任何一个需要大规模采购这类芯片并部署到应用上的公司,都必须考虑底层架构安全。这些企业也有相当大的动力来找到英伟达之外的更多选择,以保证供应链安全和稳定。

/10/

断供风险和替换代价,

哪个伤害更大?

李丰:如果放下创业者的身份,从知乎大V(ID:mackler)的角度来看,在中美竞争的诸多现实影响下,你怎么看待未来几年中国芯片行业的发展?

季宇:中国有大量互联网公司建立在水平分层的行业现状之上,而且上面的层次正变得越来越厚重,所以无论未来中美是否会割裂,割裂的程度如何,行业本身的底层逻辑是很难去违背的,你很难找到替代方案。

过去十年间,无论是中国还是海外其他国家,真正能影响到英伟达市场份额的企业凤毛麟角。

所以面对中美关系变数可能带来的断供风险,如果是采取替代方案,要与行业惯性正面对抗,颠覆行业的上层分层,代价是需要客户承担的。这背后要衡量的是,究竟断供风险和替换代价,哪个伤害更大?

从我自身的认知来看,把上层的所有东西都颠覆掉,这样的代价是当前大家完全无法接受的,甚至比断供还难以接受。

对断供风险的防御,确实给了国产芯片很多的试错空间和机会,但是从做国产芯片的角度,大家还是需要不断思考,哪些机会既能顺应市场化需求,又是美国禁令之下,中国芯片的市场空间。

李丰:既然我们提到了国产芯片,有一个绕不开的话题,就是你的前东家华为。你怎么看待华为在广义的芯片和制程方面所处的阶段,以及可能会取得的阶段性进展?作为一个AI芯片创业公司的CEO,你怎么看待华为的AI芯片?

季宇:华为是一个非常擅长做端到端解决方案的公司,包括它“以客户为中心”的理念等,构成了它的底色。正是这个底色在一定程度上促成了华为在通讯、手机,甚至包括在车等领域获得巨大成功。

从我自己的认知出发,华为更适合的还是这类垂直行业,它适合端到端的全栈打通,因为它有软件的人,有硬件的人,有做产品的人,端到端打通是最符合它底色的事情。

这种基因有它的优势,也有它相对的劣势。一旦到了水平分层的行业,它的很多做法其实是有挑战的。

换句话讲,今天大家说华为的Ascend 910B能不能去替代英伟达?我觉得这个事情你既不能说不能替代,也不能说能替代,得看你希望的替代是一个什么样的替代?

比如说你面向行业客户,希望有一个端到端的系统,能够解决行业客户在大模型或者其他AI应用领域的需求,这种我们可以理解为是一种ToB的替代。

这种是可以替代的,因为今天你要跑大模型,你用英伟达的方案加上面的整个开源体系的软件栈,或者用华为的芯片加上适配好的相应的软件,都是没有任何问题的。但是从互联网,包括大模型公司这种非常开发者的基因,照着水平分层的计算机系统的替代来讲,它其实是很难去替代的。

李丰:抛开华为跟你有关的AI芯片这一块,往后看个三四年,华为在芯片这块会可能变成什么样?

季宇:照目前的发展路径,华为一定会努力把芯片供应链各方面的问题逐步解决。这个既符合华为的利益,也符合中国半导体产业的利益,所以它一定会不断去推进这个事情。

这对于整个国内芯片产业也是一件好事,最终也能给我们这样的创业公司带来好处。

从在国内做芯片创业的角度,我们肯定希望自己的产品,能通过计算机形态、软件生态这些我们擅长的方面,为芯片供应链创造更多的有利条件。那反过来,华为如果能推动国内的芯片产业在供应链能力上的大进步,对我们来讲也会获得更多的安全边界,这个是可以相辅相成的。

/11/

“直线追击”还是“弯道超车”?

李丰:广义上跟芯片相关的这些事情,通常有两种追赶方法。一种叫直线追击,就是“用英伟达的方法做英伟达”。比如说华为在做的昇腾,就有这个直线追击的过程。直线追击需要耗费非常多的资源、资金和能力。另外一种我们更熟悉,也就是“弯道超车”,选不同的方式达到长期相似的结果。

在AI芯片这个赛道上,峰瑞作为一个早期投资机构,目前投过的芯片都是稍微“异构”一些的,就不是用英伟达的方式来做AI相关的这些芯片架构,其中既包括了比如说光子芯片(即以光子替换电子执行AI数学运算用对光子的控制来做线性计算),又比如说在开源架构上用RISC-V来做等等。从你的角度来看,所有这些与单纯GPU异构的芯片有什么机会和挑战?

季宇:首先,算力芯片行业本就是一个垄断行业,所以直线型追击是非常难的。这个难不光是技术上的难,更多是商业上的难,因为这个商业结构就是垄断型的。

做算力芯片一定要考虑清楚一件事情,就是你要么垄断,要么死。基本上只有这两种可能性,不太可能说我可以舒舒服服地做一个行业老二或老三。

其次,如果你希望做一个垄断的品类,那这个垄断的品类它怎么去构造这个垄断?它不是一个纯技术问题,它涉及到完整的商业逻辑问题。如果你只是单纯做一个新技术,没有办法突破我们之前讲的水平分层的商业结构,切不进去,你就很难做成一个高度垄断的品类。

/12/

透过表面的诸多不确定性,

去找到底层的确定性

李丰:下一个问题也跟投资有关。我印象中,大概半年多以前你们刚刚筹备创业时,行业当时还处在相对有点冷的阶段。大家对于这类不同架构的AI芯片创业企业还是有诸多疑虑的。但是过去这两个月,这个方向好像开始有点热了起来。我的这种印象是否符合你的体感?

季宇:首先,行业肯定有一定的周期,投资其实也是一个波动很快的事情。

从我们自己的角度,当有更多的机会能拿到更多资源时,我们一定会努力去拿更多资源。不过,做芯片这个事情的周期是很长的,尤其当你想去改变计算机行业的底层逻辑,周期会更长,它很难在一两年就能落地,只能是一点点去改变。

创业不单是做技术做产品,必然涉及到融资。所以不管行业是变得热了一点,还是说冷了一点,凡事都有其两面性。

热的时候,你可能可以拿到更多资源。但冷的时候,其实整个行业的噪音也会更少一些。

所以其实我自己倾向于相对保守地去看待所有的事情。太保守也不行,那样只会看到绝望。相对保守能让你看到事物的两面性,如何抓住机会不断地放大两面性中对我们有利的那一面。

很多人看到今天英伟达的强大,会生出绝望的感觉,觉得它各方面都很强,完全打不过。它确实很强,但它很强的另一面是诸事都要兼顾,这就给了我们破局的机会。这个两面性在任何一个事情上都可以找到,也是我们在所有的不确定性里面去找确定性的一种方法。

李丰:从决定创业到现在,你有觉知到自己身上的变化么?

季宇:我自己一直以来的特质可能就是对行业的洞察力是比较深的,其次就是能透过表面的诸多不确定性去找到底层的确定性。对于创业来说,这是挺重要的一件事,也就是面对很多的不确定性,你怎么保持自己的内心足够稳定。

坦白说,2023年我做出创业这个决定其实还是挺冲动的,很多事情都没有准备明白就出来了,但是我把最关键的一件事想清楚了,就是对商业的思考。

至于融资、搭团队等其他方面,出来时并没有准备得很齐备,但这些未来都是可以边摸索边学习和积累的,唯独商业本质这件事没人能教会你,只能自己不断地去洞察。

李丰:这点我很赞同。从投资人角度看,从2014年到现在这十年间,AI领域至少陆续出现了四波比较有意思的热潮——自动驾驶、数据中台、AI for science(比如AI加生物制药,AI加材料)、AI加大模型。

一种技术会经历非常多次的泡沫和低潮,这个过程中也伴随着技术的进步和应用的迭代。通常,技术的进步会发生在泡沫初期,应用迭代则发生在技术泡沫慢慢下去的时候。所以技术和应用的推广会经历很多次的泡沫产生和消散。

如果落到大模型上,这是大模型的第一次热潮,却是AI的第四次热潮,其中自动驾驶就经历了三次热潮,我相信大模型未来也还会有若干次的热潮涌现,也会出现更多有意思的行业变化。

这里我们讲的AI既包括数据层,也包括算法层、芯片层,以及最底层的能源层,每一层大概都会因为这样的变化和泡沫的起伏产生新的机会。我们也希望AI芯片相关的创业公司,都能像季宇讲的这样,持续从不确定性中提炼出最重要的长期确定性,实现成功。

注:文/李丰 季宇,文章来源:峰瑞资本(公众号ID:freesvc),本文为作者独立观点,不代表亿邦动力立场。

文章来源:峰瑞资本

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0