贵宾登录

PCIe新革命

日期: 2024-08-31 09:03

  实际上,到 PCIe 5.0 和 6.0 标准时,铜缆就已经开始吃力了。这也是为什么 PCI-SIG(PCIe 标准的制定组织)在 2024 年 5 月 1 日宣布了新的 CopprLink 内部和外部电缆规范。CopprLink 电缆规范具有相同的外形尺寸,可以提供 32.0 和 64.0 GT/s 的信号传输,并利用由 SNIA 维护的完善的行业标准连接器外形尺寸。但是 CopprLink 的传输距离仍然很有限,单个系统内仅为 1 米凯时appios,机架到机架连接的最大可达 2 米。

  再加上考虑到重定时器的使用既复杂、昂贵又耗电,而且有其局限性,因为每个链路只能使用两个重定时器。接下来,光互连将成为 PCIe 架构继续演进的重要一部分。

  这点可以从 PCI-SIG 的动作看出,2023 年 8 月凯时appios,PCI-SIG 成立了一个光学工作组探索光学连接直接耦合放大器,计划采用多种光学技术来支持 PCIe,包括可插拔光收发器、板载光学器件、共封装光学器件和光学 I/O凯时appios,标准化光纤上 PCIe 的工作和行为方式。光纤通信具有更长距离和更高数据速率的潜力,并且与日益耗电的铜线传输相比,可以显著降低功耗。

  总的来说,PCI-SIG 正在采取两条腿走路的策略:一方面在为 128.0 GT/s 的 PCIe 7.0 架构开发 CopprLink 电缆;另一方面,在积极推动 PCIe 光纤互连的工作,PCIe 光互连对于将基于 PCIe 的 GPU 集群扩展到多个机架和行、提高 AI 模型性能和提高 GPU 利用率至关重要。PCI-SIG 希望 CopprLink 电缆和光学互连能够相互补充。

  在实现光互连的路上,已经有越来越多不同产业链的厂商参与进来,这为光互联的发展起到了很大的推动作用。

  在 2024 年的光纤通信会议 ( OFC ) 大会上,Alphawave 与多家光学供应商合作开展了一项非重定时光学研究,使用 Alphawave PipeCORE PCIe 6.0 子系统 IP(适用于 PCIe 和 CXL)在评估板上运行脉冲幅度,以驱动使用 PCIe 6.0 数据的光学系统,并始终实现小于 1 × 10 -9 的 BER ,这至少是性能裕度的 3 个数量级。Alphawave 是一家提供用于数据中心、通信和人工智能应用的高速连接技术,专注于开发和制造高速接口芯片和解决方案,如 PCIe、CXL 和 Ethernet 连接器。

  6 月 11 日,专用连接解决方案厂商 Astera Labs 首次展示了数据中心 GPU 集群的端到端 PCIe 光纤传输技术。在演示中,他们组装了两种常见配置以扩展覆盖范围:从头节点到 GPU 集群,以及从头节点到远程分散的内存系统按钮开关。系统通过单模光纤实现了全速率 PCIe 传输,总带宽达到 128GB/s,覆盖范围为 20 米。不过根据实际应用需求,该覆盖范围可以轻松扩展至 50 米或更长。

  从最简单的构建块(如 GPIO)到最先进的高速接口,IP 子系统是芯片制造生态系统的命脉。目前,新思科技和 Cadence 这两家业界领先的 EDA 公司正积极投入到 PCIe 7.0 光纤接口的研发中,力求为高速互联提供更具创新性的解决方案。

  新思科技和 OpenLight 在 OFC 2024 期间展示了世界上首个采用线性驱动方法的 PCIe 7.0 光纤数据速率演示。该演示展示了端到端链路 BER 性能比 FEC 阈值高出几个数量级,证明了以 128Gbps PAM4 运行的 PCIe 7.0 光纤的可行性。值得一提的是,新思科技推出了首个 PCIe 7.0 IP,通过正在进行的互操作性演示和 PCIe 7.0 数据速率和基于光纤的 PCIe 6.x 的出色现场结果,有助于降低集成和风险,并使一次通过硅片成功成为可能。

  英特尔是光互连的多年研究者,在 2024 OFC 上,英特尔推出了其首款与计算处理器共同封装的光输入 / 输出 ( I/O ) 芯片组,该芯片组支持 64 个 PCIe 5.0 通道,每个通道双向传输速度为 32 GT/s,总计 4Tbps,使用光纤传输距离可达 100 米。而且其功耗很低,据英特尔称,该芯片组使用密集波分复用 ( DWDM ) 波长,每比特仅消耗 5 皮焦耳,比每比特消耗约 15 皮焦耳的可插拔光收发器模块节能得多。

  虽然 PCIe 是一个出色的互连技术,但是近年来,随着 AI 和机器学习的迅猛发展,对计算、内存和互连都提出了新的要求,一种基于 PCIe 的全新的高速互连标准——CXL,正在成为 AI 时代的 运力 引擎。

  CXL(Compute Express Link)是由英特尔于 2019 年发起的一项开放性行业标准,可增强处理器、内存扩展和加速器之间的通信。CXL 建立在 PCIe 框架之上,从技术上看,CXL 是通过 PCIe 物理层传输信号,但在协议层面上引入了新的特性和改进,以显著提升系统中处理器、加速器和内存设备之间的数据交换效率和一致性校准因数,使得资源共享具有更低的延迟,减少了软件堆栈的复杂性,并降低了整体系统成本凯时appios,为高性能计算和大规模数据处理提供了更为强大的支持。

  Rambus 近期成功演示了 CXL 与光纤的无缝对接。Rambus 利用 Samtec Firefly 光缆技术,将 CXL 端点设备与 Viavi Xgig 6P4 训练器连接,成功构建了一个远程 CXL 内存扩展 模块。具体而言,Rambus 的被测设备(DUT)搭载了 CXL 2.0 控制器,以四通道 16 GT/s 的速度运行。Viavi Xgig 6P4 则模拟根复合设备,通过支持 16 GT/s 速率的 Samtec Firefly PCUO G4 光缆与 DUT 连接。测试结果表明,DUT 在四倍速率下稳定运行,达到了预期性能。更重要的是,在设备发现阶段和 CXL 2.0 合规性测试中,DUT 表现出色,顺利通过了所有标准测试。

  国内方面,2024 年 8 月 2 日,曦智科技与紫光股份旗下新华三集团合作,成功将曦智科技片间光网络技术 ( Optical inter-chip Networking, oNET ) 应用于新华三集团 CXL-O 光互连解决方案,实现服务器作为主机读写挂载于 CXL 2.0 交换机后的内存资源,并顺利完成了相关带宽、延时和压力等测试内容。曦智科技自成立以来,专注于光电混合算力新范式,oNET 是曦智科技原创核心技术之一。

  作为近几年才诞生的互联技术—— CXL,发展迅速,据 Yole Intelligence 称,CXL 市场预计从 2022 年的 170 万美元增长到 2026 年的 21 亿美元,其中 70%(即 15 亿美元)将由 CXL 内存解决方案构成。

  值得一提的是,8 月初,Kioxia(铠侠)推出了具有光学接口的宽带 SSD,通过用光学接口取代电线接口,该 SSD 技术显著增加了计算和存储设备之间的物理距离,减少了接线,同时保持了能源效率和高信号质量。目前,Kioxia 已经能够将存储驱动器放置在距离 CPU 最远 40 米的距离,但计划在未来将这一距离增加到 100 米。

  长远来看,PCIe 架构在中长期内在各种高增长垂直领域依然展现出强大的增长潜力。根据 ABI Research 的《PCI Express 市场垂直机会》报告,汽车和网络边缘领域为 PCIe 技术提供了最高的增长机会,预测期内的总潜在市场 ( TAM ) 和复合年增长率 ( CAGR ) 分别达到 53% 和 38%。

  汽车行业能够从 PCIe 技术的广泛应用中获得巨大价值,因为它可以整合电气 / 电子 ( E/E ) 系统,并帮助解决自动驾驶汽车在安全性和效率方面的挑战。而在数据中心等高性能应用领域,对新 PCIe 技术的需求将保持长期的持续增长。PCIe 技术的前向和后向兼容性为决策者提供了灵活性,缩短了价值实现时间并降低了部署风险,这也促使 AI 行业的采用率不断提升。除了性能之外,PCIe 技术的关键驱动因素还包括能效、安全性和 价值实现时间 。

  而 PCIe 的未来演进路线中,光学必然是一块重要的拼图。光学 PCIe 的发展契合了当前大数据凯时appios、人工智能等领域对高性能计算的需求。在高速数据传输的需求驱动下,光学技术不仅在理论上展现出巨大潜力,更在实践中不断突破极限。随着更多厂商的加入和技术的不断演进,未来的数据互联将会迎来更加高效和高速的新时代。