星期六, 13 12 月

Google「负30%利润率」TPU暂时压制GPU 但辉达Blackwell晶片准备清场

资深科技投资人贝克(Gavin Baker)日前在访谈中表示,Google的张量处理器(TPU)目前暂居上风,但长期而言,辉达(Nvidia)的绘图处理器(GPU)凭借更全面的生态系,仍较具优势。

科技基金Atreides Management经理人贝克9日在Invest Like The Best播客节目中说,从Hopper晶片转换到Blackwell,「是目前为止我们在科技领域经历过最复杂的产品转换」,而Blackwell的大规模部署近几个月才开始。

辉达的Blackwell平台大幅延迟,是因为这个转换需从根本上调整基础设施,难题包含更高的用电量、液冷系统、更重的资料中心机架,以及散热管理等,而Blackwell的延迟,意外为Google创造了有利窗口。

贝克说,Google在短期内取得优势,是藉著其TPU晶片,成为人工智慧(AI)词元(token)的最低成本生产者。在结合其他如搜寻引擎等业务下,这让Google得以在负30%的利润率下营运。他说,Google不断「抽走AI生态系的经济氧气」,是合理的策略,但可能只是暂时性的。

他也强调,随著辉达的Blackwell晶片明年初开始用于训练,还有随后更易部署的GB300晶片,这种局面即将改变。他说,一旦Google失去成本优势,可能会重塑AI产业的竞争格局与经济模式,「那迟早会发生」,而Rubin晶片的推出,可能会进一步拉大与TPU和其他客制化AI晶片的效能与成本差距。

另外,贝克认为,第一款由Blackwell晶片驱动的模型将由马斯克的xAI推出,原因很简单,因为黄仁勋公开说过,马斯克建造资料中心的速度无人能比。而即便有了Blackwell晶片,仍需六到九个月才能将效能提升到Hopper的水准。

贝克强调,xAI对辉达具有关键作用。xAI快速部署的速度,让辉达能在资料中心内尽可能部署更多的GPU,形成协同运作的晶片群,进而为所有客户进行除错。

贝克的访谈著眼于主要AI基建业者间日益激烈的竞争。马斯克隔日在X上发文表示:「AI是有史以来最顶尖的对决。硬体的部署速度,尤其是机器人领域,是关键所在。」

贝克指出,从Hopper、Blackwell到未来的Rubin,辉达的GPU强调的是全端平台,从GPU、网路卡、交换器到 CUDA等软体层,一手包办。企业买了GPU后,可取得一整套能直接投入训练和推论的完整系统,不需自行组装网路或重写软体。

相较下,Google TPU的本质是特殊应用IC(ASIC)。Google负责前端设计,后端由博通制作,再交由台积电生产。TPU其他不可或缺的零件,如交换器、网卡和软体,Google都得自己整合,供应链协作比GPU复杂许多。

整体来说,GPU的优势不在於单颗晶片的效能,而是整个平台与生态系的完整度。

$(document).ready(function () {nstockStoryStockInfo();});

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注