摘錄來源:西部證券;分析師:楊敬梅、胡琎心 AI服務(wù)器電源三大架構(gòu)各司其職以確保電力供應(yīng) 人工智能(AI) 技術(shù)的飛速發(fā)展引發(fā)了對(duì)計(jì)算能力的巨大需求, AI 服務(wù)器電源的作用越發(fā)凸顯。 數(shù)據(jù)中心電源的架構(gòu)主要分為保障電路 UPS、 機(jī)架電源 AC/DC、芯片電源模組DC/DC 三個(gè)層級(jí),用以將電壓從 1-3 萬伏特降低至 0.5~1 伏特, 進(jìn)而使數(shù)據(jù)中心的電力成功從電網(wǎng)傳輸?shù)郊铀倨餍酒?/span> UPS(不間斷電源): UPS 是連接蓄電池和主機(jī)的系統(tǒng)裝置, 可通過逆變電路等模塊將直流電轉(zhuǎn)化為市電。當(dāng)市電正常時(shí), UPS 對(duì)電壓和頻率進(jìn)行在線控制,進(jìn)而為負(fù)載提供穩(wěn)定電壓和頻率的優(yōu)質(zhì)交流電,同時(shí)給蓄電池充電; 當(dāng)市電故障,如發(fā)生斷電、過/欠壓時(shí),逆變電路則將蓄電池的直流電轉(zhuǎn)化為電壓和頻率穩(wěn)定的交流電給負(fù)載供電, 以維持其正常工作并防止數(shù)據(jù)丟失。 AC/DC: AI 服務(wù)器功率更高,消耗的電力也更多。 傳統(tǒng)的電壓輸出一般為 12V, 但為了減少電力的損耗, 電壓輸出需要提升至 50V, 并經(jīng)過層層降壓以達(dá)到芯片的工作電壓。 PDU輸入的交流電在 AC/DC 環(huán)節(jié)經(jīng)過降壓、整流兩個(gè)過程最終輸出 50V 直流電。 DC/DC: DC/DC 環(huán)節(jié)進(jìn)一步將電壓調(diào)降至芯片可用電壓,一般而言分為兩步進(jìn)行:首先是 50V 降至 12V,然后是12V 降至 0.8V。 數(shù)據(jù)中心電源的架構(gòu)主要分為保障電路UPS、機(jī)架電源 AC/DC、芯片電源模組 DC/DC 三個(gè)層級(jí) AI行業(yè)高速發(fā)展,電力需求大幅提升。 算力核心設(shè)備逐漸由傳統(tǒng)的 CPU 向GPU 轉(zhuǎn)移,在提升計(jì)算效率、實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)處理和深度學(xué)習(xí)模型的同時(shí)也帶來了高能耗。 根據(jù)國(guó)際能源署(IEA)的數(shù)據(jù), 2023 年英偉達(dá)芯片的電力消耗已達(dá) 7.3TWh, 預(yù)估至2026 年, 這一數(shù)字將升至 2023 年的十倍。與此同時(shí) AI 服務(wù)器電源需求大幅提升。 AI服務(wù)器電源需求同步快速增長(zhǎng)。 受益于 AI 大模型快速發(fā)展, 算力需求快速提升, 而AI 服務(wù)器作為算力承載的核心基礎(chǔ)設(shè)施,其出貨量有望快速增長(zhǎng), 根據(jù) TrendForce, 2022-2026 年AI 服務(wù)器出貨量 CAGR 將達(dá) 29%。大模型 AI 訓(xùn)練服務(wù)器對(duì)算力需求更高, 其服務(wù)器電源功率和配置數(shù)量明顯提升。 AI服務(wù)器電源在其功率密度和效率方面提出了較高要求。 功率方面, AI 系統(tǒng)在訓(xùn)練過程中需要用到GPU 和 TPU 等加速器, 它們可以處理重復(fù)性和密集型計(jì)算, 但卻異常耗電, 隨著計(jì)算機(jī)性能的升級(jí), 功率需求也隨之提升。 功率密度方面, AI 服務(wù)器電源在使用時(shí)需要插入標(biāo)準(zhǔn)機(jī)架中, 電源功率隨著算力需求的增加而提升, 功率密度的提升是最大的難點(diǎn)。AI 服務(wù)器電源的功率密度可達(dá) 100W/立方英寸, 遠(yuǎn)超普通服務(wù)器電源的 50W/立方英寸。轉(zhuǎn)換效率方面, 傳統(tǒng)服務(wù)器電源的轉(zhuǎn)換效率一般在 96%,而 AI 服務(wù)器電源則需達(dá)到97.5%-98%的高標(biāo)準(zhǔn),以降低能量損耗并支撐更高功率密度的 GPU。 英偉達(dá)芯片放量, AI 服務(wù)器電源產(chǎn)品不斷迭代更新。 據(jù) TechInsights 統(tǒng)計(jì),英偉達(dá) 2023 年數(shù)據(jù)中心GPU 出貨量約為 376 萬塊, 同比增長(zhǎng) 42%,市場(chǎng)份額高達(dá) 98%,英偉達(dá) GPU 幾乎成為數(shù)據(jù)中心標(biāo)配。 英偉達(dá)于24 年 3 月 18 日在GTC大會(huì)上發(fā)布新一代 AI 芯片 Blackwell GPU, 基于該GPU 組成的 GB200 性能達(dá)到了 H100 的 7倍, 同時(shí)顯著降低成本和功耗。據(jù) TrendForce 預(yù)測(cè), GB200將于2024 年底以結(jié)構(gòu)相對(duì)簡(jiǎn)單的 NVL 36 率先導(dǎo)入, 而 NVL72 將以主推形式于 2025 年放量,屆時(shí) AI 服務(wù)器電源將成為服務(wù)器電源市場(chǎng)新增量, 預(yù)計(jì) 2026年AC-DC 市場(chǎng)規(guī)模有望達(dá) 53 億美元。 英偉達(dá)Blackwell
GPU 芯片性能大幅提升 英偉達(dá) GPU 成為數(shù)據(jù)中心標(biāo)配, AI 服務(wù)器新品 GB200 有望于 2025 年放量。 據(jù)TechInsights 統(tǒng)計(jì), 英偉達(dá) 2023 年數(shù)據(jù)中心 GPU 出貨量約為 376 萬塊, 同比增長(zhǎng) 42%,市場(chǎng)份額高達(dá) 98%,英偉達(dá) GPU 幾乎成為數(shù)據(jù)中心標(biāo)配。英偉達(dá)于 24 年 3 月 18 日在GTC 大會(huì)上發(fā)布新一代 AI 芯片 Blackwell GPU, 基于該 GPU 組成的 GB200 性能達(dá)到了H100 的 7 倍,同時(shí)顯著降低成本和功耗。據(jù) TrendForce 預(yù)測(cè), GB200 將于 2024 年底以結(jié)構(gòu)相對(duì)簡(jiǎn)單的 NVL 36 率先導(dǎo)入, 而 NVL72 將以主推形式于 2025 年放量。 在英偉達(dá)大力擴(kuò)展 CSPs 客群的情況下, 預(yù)估 2025 年 GB200 折算 NVL36 合計(jì)出貨數(shù)量可望達(dá) 6萬柜, 而 GB200 的 Blackwell GPU 用量可望達(dá) 210-220 萬顆。
|
|