沃卡logo

转折倒计时:AI服务器距离全面占领市场还要多久?

2023-10-27来源:

当超大规模厂商和云服务商考虑自己的基础设施规划问题时,首先会确定整体运行功耗,之后是挑选服务与存储组合以及额定功率下所能提供的总容量。当然,预算也是个大问题,毕竟金钱才是让这个世界维持运转的基本动力。

正所谓我爱容量、速度、插槽和功率,但我更爱金钱,毕竟资金投入才代表着最终得分、真实立场。所以在IDC和Gartner在过去两年间中止了服务器销售跟踪报告之后,我们本周碰巧在用谷歌搜索服务器销量预测时看到了一个有趣的页面。其中包含IDC公布的2022年至2027年预测数据,于是我们立马将其粘进Excel表格并开始分析。

IDC对于服务器预测的评论大多不对外公开,但却在2022年9月下旬发布了一份摘要。现在我们就据此看看接下来全球服务器市场有可能走向何方。

先从一份图表入手,其中显示的是2022年全球服务器收入数据,以及之后2023年至2027年间的所有预测:

我不喜欢这份图表,因为IDC用于表现增长率的第二条Y轴差点就触底了,让人以为增长接近于零,其实最低位也有4.3%。为此我们重新制作了下面这份图表,并加入了2021年的实际收入数据:

再来看表格中引用的各条实际数据:

这份数据集不仅包含服务器收入和未来五年的预测,而且将x86和非x86服务器做了明确区分。其实在过去十年间,将二者剥离开来其实无甚必要,毕竟非x86设备中有约三分之二都来自IBM销售的Power系统和System Z大型机,其余部分则主要是其他专有设备和Arm服务器。但随着Arm服务器在超大规模基础设施运营商和云服务商中间的兴起,非x86部分的变化趋势开始变得越来越有看点。而且预计随着RISC-V设备在未来十年间加入战团、逐步普及,这种丰富性将继续扩大下去。所以说,接下来一段时间的情况很可能跟之前截然不同。

我们还从IDC的服务器跟踪报告当中,收集到了2020年IBM System z和Power系统的收入数据。这部分收入总额是49.8亿美元,意味着非x86类别中的Arm/其他产品共占得38.7亿美元。至于IBM产品的后续发展动向,其中Power 10和z 16设备的升级周期为2021年和2022年,Power 11和z 17设备的升级周期则为2025年。而且由于Power和z系列大型机中计算容量的提升速度要高于在线事务处理及其他计算需求,所以这部分收入恐怕将普遍下降,就是说IBM的服务器硬件销售额将逐渐缩水。具体来讲,有可能从2020年的近50亿美元下降至2026年的35亿美元,到2027年则可能进一步萎缩至33亿美元。但参照IDC基准数据,那么非x86业务中的Arm/其他部分则将保持非常健康的增长速度,而这同样受到超大规模基础设施运营商和云服务商的有力推动。但即使形势大好,这两类买家的承受力也是有上限的,因此Arm和RISC-V服务器(我个人认为还是Arm部分占大头)的总和年收入应该在200亿美元左右。也就是说,Arm服务器将在总体服务器市场上占比达10%,仍远低于我们今年1月从Gartner和富国银行在截至2026年的预测讨论中给出的、高达20%的Arm服务器份额估计。

而且由于众多超大规模基础设施运营商和云服务商都在积极选用定制化Arm服务器CPU和AI协处理器,所以实际选择范围应该会很广,同时也要考虑如何在性价比上跟市面上的绝对主流方案相抗衡,即x86服务器CPU加英伟达GPU这套面向AI/其他计算密集型工作负载的黄金组合。

说到这里,我们真正好奇的是AI服务器的销售(大部分设备用于训练,也有一部分用于推理)跟其他服务器到底有何不同。我们还想了解去年和今年以来,持续高企的通货膨胀究竟给各大服务器制造商的收入增长造成了哪些影响。可以肯定的是,GPU已经成为通胀压力下的稀缺资源,炽热的市场需求碰上严重短缺的产能供应正把价格推向畸形的高位。

IDC在其报告中表示,“2022年之后的每个季度,通货膨胀对于服务器的直接影响都会进一步加剧。服务器销售价格的同比增长率在2023年第二季度上涨了29%;而在2022年内长期保持在百分之十几的出货单位量,则在2022年第四季度下降至可怜的1.4%,到2023年第一季度又同比下降10%,第二季度更是进一步下降19.9%。”

相对于目前已经居于高位的平均售价增长率而言,服务器出货量则大幅下降,这主要是受到AI训练/推理节点(每个节点通常搭载四到八个GPU,因此单节点成本就高达数十万美元)那高昂的价格所推动。因此,未来的分析确实有必要把AI与非AI服务器区分开来,因为二者在市场上已经分属完全不同的区位。所以,我们根据2020年至2027年IDC的宏观服务器收入预测,尝试整理出如下图表:

我们知道这里存在主观臆断的成分,但从基本面上讲,判断的思路应该基本吻合当前、短期未来以及最近几年来的总体市场趋势。

得出的结论是,除非有什么特殊情况减缓了AI模型的增长、或者是让AI训练和推理计算突然变得成本低廉,否则到2026年或2027年时,AI计算很可能将在全球服务器市场上占据半壁江山。

这套预测模型假设非AI服务器收入自2022年开始急剧下降11.2%,2023年有所改善仅下降5%,之后每年都与GDP的缓慢增幅基本保持一致。而同样是在2022年到2023年之间,AI服务器的收入将实现近5倍的惊人飞跃,之后在2024年实现20%的健康稳定增长,并最终在2027年放缓至15%。这里我们并不能明确断言AI服务器可以保持这样的增长势头,只是假设非AI服务器仍然处于之前几年的漫长增长/消费周期,余下的净增部分全部归于AI服务器业务。

因此,目前市场上呈现出的这波爆发式增长将随着英伟达GPU供应量的增加和单位价格下降,以及其他品牌GPU及更多种类加速器逐渐步入市场而逐渐归于平缓,最终进入新的增长稳态。

要想准确预测未来的服务器市场态势,我们还需要回答一个重要问题:全球AI市场到底需要多少服务器硬件供应。我们承认,对未来四、五年的情况做出预测的确非常困难。如果AI加速顺长期合计且价格保持在高位,那么相应收入也将居高不下。而如果产能实现倍增甚至扩大到三倍,而产品单位降低一半或三分之二,则总收入会保持不变。当然,这些都只是假设,欢迎大家结合自己的感受做出判断。

很明显,没人愿意牺牲毛利率来换取更高的产品销量。但激烈的竞争——比如英伟达因太过成功而在市场上激起竞争对手的反扑——终归会让不合理归于合理,迫使企业走上以利润换销量的道路。

有趣的是,从1985年到2000年,RISC/Unix机器和互联网技术的腾飞,再加上大型机和专有小型机的积极更新换代,前后花了15年时间也才在服务器总收入中拿下45%的份额。所以如果遵循这样的规律,那么AI服务器可能同样需要15年时间才能在全球服务器总收入中占比45%,而具体时段可能是2010年到2025年、也可能是2011年到2026年。但无论如此,届时AI工作负载将取代、或者全面增强我们所能想到的各种软件应用,开启一个前所未有的智能新时代。

  图片使用申明:原创文章图片源自‘Canva可画’平台免费版权图片素材;引用文章源自引用平台文章中所使用的原图。