星期六, 13 12 月

Google「負30%利潤率」TPU暫時壓制GPU 但輝達Blackwell晶片準備清場

資深科技投資人貝克(Gavin Baker)日前在訪談中表示,Google的張量處理器(TPU)目前暫居上風,但長期而言,輝達(Nvidia)的繪圖處理器(GPU)憑藉更全面的生態系,仍較具優勢。

科技基金Atreides Management經理人貝克9日在Invest Like The Best播客節目中說,從Hopper晶片轉換到Blackwell,「是目前為止我們在科技領域經歷過最複雜的產品轉換」,而Blackwell的大規模部署近幾個月才開始。

輝達的Blackwell平台大幅延遲,是因為這個轉換需從根本上調整基礎設施,難題包含更高的用電量、液冷系統、更重的資料中心機架,以及散熱管理等,而Blackwell的延遲,意外為Google創造了有利窗口。

貝克說,Google在短期內取得優勢,是藉著其TPU晶片,成為人工智慧(AI)詞元(token)的最低成本生產者。在結合其他如搜尋引擎等業務下,這讓Google得以在負30%的利潤率下營運。他說,Google不斷「抽走AI生態系的經濟氧氣」,是合理的策略,但可能只是暫時性的。

他也強調,隨著輝達的Blackwell晶片明年初開始用於訓練,還有隨後更易部署的GB300晶片,這種局面即將改變。他說,一旦Google失去成本優勢,可能會重塑AI產業的競爭格局與經濟模式,「那遲早會發生」,而Rubin晶片的推出,可能會進一步拉大與TPU和其他客制化AI晶片的效能與成本差距。

另外,貝克認為,第一款由Blackwell晶片驅動的模型將由馬斯克的xAI推出,原因很簡單,因為黃仁勛公開說過,馬斯克建造資料中心的速度無人能比。而即便有了Blackwell晶片,仍需六到九個月才能將效能提升到Hopper的水準。

貝克強調,xAI對輝達具有關鍵作用。xAI快速部署的速度,讓輝達能在資料中心內儘可能部署更多的GPU,形成協同運作的晶片群,進而為所有客戶進行除錯。

貝克的訪談著眼於主要AI基建業者間日益激烈的競爭。馬斯克隔日在X上發文表示:「AI是有史以來最頂尖的對決。硬體的部署速度,尤其是機器人領域,是關鍵所在。」

貝克指出,從Hopper、Blackwell到未來的Rubin,輝達的GPU強調的是全端平台,從GPU、網路卡、交換器到 CUDA等軟體層,一手包辦。企業買了GPU後,可取得一整套能直接投入訓練和推論的完整系統,不需自行組裝網路或重寫軟體。

相較下,Google TPU的本質是特殊應用IC(ASIC)。Google負責前端設計,後端由博通製作,再交由台積電生產。TPU其他不可或缺的零件,如交換器、網卡和軟體,Google都得自己整合,供應鏈協作比GPU複雜許多。

整體來說,GPU的優勢不在於單顆晶片的效能,而是整個平台與生態系的完整度。

$(document).ready(function () {nstockStoryStockInfo();});

發表回復

您的郵箱地址不會被公開。 必填項已用 * 標註