亚洲精华国产精华精华液网站,你懂的,娇生惯养4ph归寻(矜以),丰年经继拇中文3与其他教材比较

技術頻道

娓娓工業
您現在的位置: 中國傳動網 > 技術頻道 > 技術百科 > AI服務器的內存接口芯片技術

AI服務器的內存接口芯片技術

時間:2024-01-15 17:32:48來源:智能計算芯世界

導語:?內存接口芯片行業壁壘高,三足鼎立格局已經形成。

本文來自“AI服務器元年,接口互聯芯片梳理”,據 TrendForce 數據,AI 服務器出貨約13萬臺,占全球服務器出貨約1%,展望2023年,Microsoft、Meta、Baidu 與 ByteDance 相繼推出基于生成式 AI 衍生的產品服務而積極加單,預估 23 年 AI 服務器出貨量年增率可望達 15.4%,且隨著未來 ChatGPT 對 AI 服務器需求用量,預計 2023-2027 年 AI 服務器將以 12.2%年復合增速成長。  

DGX H100 于 2022 年推出,是 NVIDIA 的 DGX 系統的最新迭代產品,也是 NVIDIA DGX SuperPOD 的基礎。DXG 服務器配備 8 塊 H100 GPU,6400億個晶體管,在全新的 FP8 精度下 AI 性能比上一代高 6 倍,可提供 900GB/s 的帶寬。

在 DGX H100 服務器內部,藍色方塊為 IP 網卡,既可充當網卡又可發揮PCIe Switch 擴展功能,成為 CPU與 GPU(H100)之間互聯的橋梁。其內部采用 PCle 5.0 標準。此外,CX7 以網卡芯片的形式做成 2 塊板卡來插入服務器,每 4 個 CX7 芯片組成一塊板卡并且對外輸出 2 個 800G OSFP光模塊口。

而 GPU(H100)之間互聯主要通過 NV Switch 芯片來實現。每個 DGXH100 內的一個 GPU 向外伸出 18 個 NVLink ,單鏈雙向帶寬為 50 GB/s,共計18*50GB/s=900GB/s 雙向帶寬,拆分到 4 個板載的 NV Switch 上去,因而每個NV Switch 對應 4-5 個 OSFP 光模塊(共計 18 個)。每個 OSFP 光模塊采用 8 個光通道,每個通道的傳輸速率為 100Gbps,因此總速率高達 800Gbps,能夠實現高速的數據傳輸。

1、CPU、GPU等組件互聯:PCIE Switch、Retimer芯片

PCIe Switch 即 PCIe 開關或 PCIe 交換機,主要作用是實現 PCIe 設備互聯,PCIe Switch 芯片與其設備的通信協議都是 PCIe。由于 PCIe 的鏈路通信是一種端對端的數據傳輸,因此需要 Switch 提供擴展或聚合能力,從而允許更多的設備連接到一個 PCle 端口,以解決 PCIe 通道數量不夠的問題。目前 PCIe Switch 不僅已經被廣泛應用在了傳統存儲系統中,而且在部分服務器平臺也逐漸普及,用于提高數據傳輸的速度。

PCIe 總線技術升級,PCIe Switch 每代速率提升。PCIe 總線是 PCI 總線的高速串行替代品。2001 年,Intel公布取代 PCI 總線的第三代 I/O 技術——“3GIO”,2002 年該項技術經過 PCI 特殊興趣組織(PCI-SIG)審核后正式改名為“PCI Express”,標志著 PCIe 的誕生。2003 年,PCIe 1.0 正式發布,可支持每通道傳輸速率為 250MB/s,總傳輸速率為 2.5 GT/s。2007 年 PCI-SIG 宣布推出 PCI Express Base 2.0 規范。在 PCIe 1.0 的基礎上將總傳輸速率提高了一倍,達到 5 GT/s,每通道傳輸速率從 250 MB/s 上升至 500 MB/s。2022 年 PCI-SIG正式發布 PCIe 6.0 規范,將總帶寬提高至 64 GT/s。

隨著PCIe 在服務器中越來越廣泛地被應用,PCIe Switch 的市場需求也被帶動起來。根據 QYResearch(恒州博智)的統計及預測,2021 年全球 PCIe 芯片市場銷售額達到了 7.9 億美元,預計 2028 年將達到 18 億美元,年復合增長率(CAGR)為 11.9%。

中國是 PCIe Switch 最大市場。隨著服務器對海量數據存儲與傳輸的要求日益提高,PCIe Switch 市場發展成為一片藍海。中國是全球最大的電子產品生產和消費國家之一,在大數據、云計算、人工智能等領域,需要大量高速互聯解決方案來實現海量數據傳輸。而 PCIe Switch 作為高速互聯解決方案,在中國市場具有極大的需求。

在 AI 服務器中,GPU 與 CPU 連接時至少需要一顆 Retimer 芯片來保證信號質量。具體而言,很多 AI 服務器都會配置多顆 Retimer 芯片,例如 Astera Labs在 AI 加速器中配置了 4 顆 Retimer 芯片。

PCIe Retimer 藍海市場三足鼎立,潛在競爭者躍躍欲試。目前譜瑞-KY、Astera labs、瀾起科技是 PCIe Retimer 藍海市場中的三家主要廠商,占據領先地位。其中瀾起科技布局 PCIe 較早,是全球可量產 PCIe 4.0 Retimer 的唯一中國大陸供應商,且目前 PCIe 5.0 Retimer 研發順利。

此外,包括瑞薩,TI,微芯科技等在內的芯片廠商也在積極投入 PCIe Retimer 的產品研發中。根據官網信息,瑞薩可提供包括 89HT0816AP 和 89HT0832P 在內的兩款 PCIe 3.0 Retimer產品;TI 可提供一款 16Gbps 8 通道 PCIe 4.0 Retimer——DS160PT801;同樣地,微芯科技于 2020 年 11 月發布 XpressConnect 系列 Retimer 芯片,可支持PCIe 5.0 的 32GT/s 速率。

2、GPU與 GPU連接:NVLink、NVSwitch

全球各大芯片廠商均在關注高速接口的相關技術,除了 NVDIA 的 NVLink 之外,AMD的 Infinity Fabric 和 Intel 的 CXL(Compute Express Link)等也為服務器內部的高速串聯提供了解決方案。

不斷迭代更新的 NVlink 掀起高速互聯技術革命。NVLink 是一種由 NVIDIA開發的高速互連技術,旨在加快 CPU 與 GPU、GPU 與 GPU 之間的數據傳輸速度,提高系統性能。從 2016 年到 2022 年,NVLink 已經迭代至第四代。

2016 年,NVDIA 發布了 Pascal GP100 GPU 所搭載的新的高速接口芯片—— NVLink , 這 是 第 一 代 NVLink 。NVLink 采 用 High-Speed Signalinginterconnect(NVHS)技術,主要用于 GPU 與 GPU 之間、GPU 與 CPU 之間的信號傳輸。GPU 之間傳輸 NRZ(Non-Return-to-Zero)編碼形式的差分阻抗電信號。第一代NVLink單鏈可實現40 GB/s的雙向帶寬,單芯片可支持4鏈路,即 160 GB/s 的總雙向帶寬。

此后,NVLink 歷經多次迭代更新,掀起了高速互聯技術革新浪潮。2017 年,基于 Volta 架構的第二代 NVLink 發布,單鏈可實現 50 GB/s 的雙向帶寬,單芯片可支持 6 鏈路,即 300 GB/s 的總雙向帶寬。2020 年,基于 Ampere 架構的第三代 NVLink 發布,單鏈可實現 50 GB/s 的雙向帶寬,單芯片可支持 12 鏈路,即 600 GB/s 的總雙向帶寬。2022 年,基于 Hopper 架構的第四代 NVLink 發布,傳輸信號變為 PAM4 調制電信號,單鏈可實現 50 GB/s 的雙向帶寬,單芯片可支持 18 鏈路,即 900 GB/s 的總雙向帶寬。

2018 年 NVDIA 發布了第一代 NVSwitch,為提高服務器內部帶寬、降低延遲、實現多 GPU 間通信提供了解決方案。第一代 NVSwitch 采用臺積電 12nmFinFET 工藝制造,共有 18 個 NVLink 2.0 接口。一臺服務器內部可以通過 12 個NVSwitch 支持 16 個 V100 GPU,實現以 NVLink 最高速率互聯。

目前 NVSwitch 已經迭代至第三代。第三代 NVSwitch 采用 TSMC 4N 工藝構建,每個 NVSwitch 芯片上擁有 64 個 NVLink 4.0 端口,GPU 間通信速率可達 900GB/s,這些通過 NVLink Switch 互聯的 GPU 可用作單個高性能加速器,擁有深度學習的功能。

3、CPU 與 DRAM高速互聯,拉動內存接口芯片

服務器內存模組主要類型為 RDIMM、LRDIMM,相較于其他類型內存模組,服務器內存模組對穩定性、糾錯能力以及低功耗均有較高要求。內存接口芯片是服務器內存模組的核心邏輯器件,是服務器 CPU 存取內存數據的必由通路。其主要作用是提升內存數據訪問的速度及穩定性,滿足服務器 CPU 對內存模組日益增長的高性能及大容量需求。

從 DDR4 至 DDR5,內存接口芯片速率持續升級。2016 年開始,DDR4 成為內存市場的主流技術,為了實現更高的傳輸速率和支持更大的內存容量,JEDEC 組織進一步更新和完善了 DDR4 內存接口芯片的技術規格。在 DDR4 世代,從 Gen1.0、Gen1.5、Gen2.0 到 Gen2plus,每一子代內存接口芯片所支持的最高傳輸速率在持續上升,DDR4 最后一個子代產品 Gen2plus 支持的最高傳輸已達 3200MT/s。隨著 JEDEC 組織不斷完善對 DDR5 內存接口產品的規格定義,DDR5 內存技術正在逐步實現對 DDR4 內存技術的更新和替代。

目前 DDR5 內存接口芯片已經規劃了三個子代,支持速率分別是 4800MT/s、5600MT/s、6400MT/s,行業內預計后續可能還會有 1~2 個子代。

內存接口芯片按功能分為兩類,分別為是寄存緩沖器(RCD)以及數據緩沖器(DB)。RCD 用來緩沖來自內存控制器的地址、命令、控制信號,DB 用來緩沖來自內存控制器或內存顆粒的數據信號。

DDR5 內存模組升級帶來內存接口芯片及模組配套芯片新機遇。2016 年全球內存接口芯片市場規模約 2.8 億美元,2018 年達到約為 5.7 億美元,三年年化增長率為 40%。DDR5 升級,將帶來內存接口芯片市場規模攀升。相較于 DDR4,由于 DDR5 支持速率更高、設計更為復雜,DDR5 第一子代內存接口芯片的起始單價比 DDR4 內存接口芯片更高。同時,隨著 DDR5 內存在服務器、PC 端的滲透率逐步提升,DDR5 相關內存接口芯片市場規模有望實現高速增長。

內存接口芯片行業壁壘高,三足鼎立格局已經形成。內存接口芯片是技術密集型行業,需要通過 CPU、內存和 OEM 廠商的全方位嚴格驗證后,方可進行大規模使用,新的玩家很難介入。隨著技術難度不斷升級,內存接口芯片玩家從DDR2 世代的 10 多家到 DDR4 世代只剩 3 家,行業基本出清,三足鼎立格局已經形成。在 DDR5 世代,全球只有三家供應商可提供 DDR5 第一子代的量產產品,分別是瀾起科技、瑞薩電子(IDT)和 Rambus。


標簽: AI芯片

點贊

分享到:

上一篇:人工智能芯片需要什么樣的基...

下一篇:直流電機調速方法有哪些?

中國傳動網版權與免責聲明:凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.siyutn.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

網站簡介|會員服務|聯系方式|幫助信息|版權信息|網站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動網-工業自動化與智能制造的全媒體“互聯網+”創新服務平臺

網站客服服務咨詢采購咨詢媒體合作

Chuandong.com Copyright ?2005 - 2025 ,All Rights Reserved 深圳市奧美大唐廣告有限公司 版權所有
粵ICP備 14004826號 | 營業執照證書 | 不良信息舉報中心 | 粵公網安備 44030402000946號

主站蜘蛛池模板: 佳木斯市| 邢台县| 湖北省| 马龙县| 神池县| 天长市| 肃宁县| 科技| 东兴市| 玛曲县| 彭水| 墨玉县| 青海省| 郓城县| 全椒县| 济阳县| 益阳市| 遂宁市| 洱源县| 大化| 平阳县| 同仁县| 洪湖市| 木兰县| 肇州县| 四子王旗| 龙陵县| 通海县| 霍州市| 赣榆县| 乌海市| 罗山县| 巨野县| 汝城县| 定远县| 民乐县| 朝阳县| 巫山县| 安远县| 永仁县| 白玉县|