AMD赛灵思开发最新光子模块,有望进一步加速人工智能计算

近日,美国半导体公司ADM赛灵思与加拿大光子互连解决方案提供商Ranovus共同展示了一款联合封装光学(CPO)系统,该系统模块结合了前者 Odin Analog Drive CPO 2.0 和 Xilinx 以 800G速度运行的 Versal ACAP的优势。Ranovus表示,新的CPO系统可以在不消耗太多电力的情况下,让数据中心的人工智能 (AI) 工作负载运行得更快,从而缩短成本。
此举使得Ranovus和赛灵思在证明了自身技术的同时,进一步展示了共同封装光学器件(即Odin描述中的“CPO”)是一个可以成功落地的概念。
Ranovus总裁兼首席执行官Hamid Arabzadeh说:“联合封装正在顺利进行。这一趋势有三个应用目标:1.帮助提高传统以太网的性能 ;2.满足人工智能训练日益增长的需求 ;3.支持内存和I/O分解的趋势。”

Odin是一种单片光电芯片,它结合了驱动器和其他基于晶体管的电路、波导和激光器的多种特性。2021年底,Ranovus推出了2.0版本。
Versal ACAP不仅仅是Xilinx的FPGA片上系统 (SoC)。它还包含了可编程逻辑、处理器内核、接口电路和其他支持功能。Xilinx将Versal称为自适应计算加速平台或 ACAP,即通过强大的功能和灵活性来加速工作负载速度——特别是AI工作负载。
Odin和Versal ACAP构成的组合是CPO实例化的关键元素,该概念旨在解决数据中心面临的多重挑战。
我们知道,随着越来越多的数据量涌入,数据中心急需更快地处理这些海量数据。同时,数据传输速率在增加数据中心的功耗也随之增长,预计当今数据中心架构将在5到10年内变得难以为继。
光子学可以实现以较小的功率传送更多的数据。但对于数据中心来说,任何微小的架构调整都会“潜伏危机”,何况一旦利用光子学技术就不只是微小的架构调整。对于光子供应商来说,已有不同的技术方法来构建激光器和波导,但数据中心运营商客户并不想“被迫从中做选择”。更重要的是,他们不希望因此而被特定的供应商所束缚——数据中心运营商希望在任何地方都实现即插即用。现在,CPO系统模块的出现将能够满足他们的需求。
2020年底,在开放光互联网论坛(OIF,Optical Internetworking Forum )上,数据中心运营商及供应商们发起了一项协同打包框架实施协议(IA),以“研究通信接口协同打包的应用空间和相关技术”为由使用一个或多个 ASIC。
2021年底,OIF定义了联合封装框架下的第一个项目:3.2T联合封装光模块IA,该组织表示将“定义一个针对以太网的3.2T联合封装光模块,利用100G电气通道切换应用。”就在几周前,OIF面向全球发布了联合包装框架文件,该组织希望鼓励大家在联合封装模块中进行创新。
在2022 OFC论坛中,赛灵思和Ranovus宣布了他们的联合CPO演示。Ranovus表示:“我们需要高能效、高吞吐量和高密度的光互连从而构建用于AI/ML平台的CPO 2.0解决方案。”
Arabzadeh提到,大量现有接口的最高容量约为 200G,而通过采用激光器直接嵌入IC硅基板,Odin在相同的占用空间内可从800Gbps扩展到 3.2Tbps。Arabzadeh相信该方法将是Ranovus的独特优势:从Ranovus量子点激光器开始,到模块能够在单个封装组件中为以太网交换机和ML/AI 硅提供Nx100Gbps PAM4光I/O通道的能力。
赛灵思和Ranovus 表示,通过使用Versal Premium ACAP将光学器件集成到封装中,能够大幅降低功耗、简化电路板布线并降低成本。
当被问及成本时,Arabzadeh表示,现有的400G模块的价格约为每台800 美元,或者每次展示性能耗费约2美元。Ranovus还将通过其生产方法来控制成本,“一切都是晶圆级的,公司将会选择晶圆上已知性能良好的裸片。”
在功率方面,Arabzadeh提到,该模块消耗大约4W,而模块替换的电子设备大约消耗14W-17W。
Ranovus还设计了有一个无集成激光器的芯片版本,并通过AMD演示的模块针对AI工作负载进行了优化。
关于CPO市场的第三次推力效益,Arabzadeh表示,Ranovus稍后将发布“关于具有池化内存并依赖于CXL的分类服务器架构的公告”。
原文链接:
https://www.eETimes.com/amd-allies-with-ranovus-on-data-center-photonics-module/#
文:Brian Santo编译:李每编辑:慕一
注:本文编译自“ EETimes”,不代表量子前哨观点。