ICC訊 對更高效能功耗比的追求,暴露了傳統(tǒng)光學(xué)收發(fā)器設(shè)計的局限性,迫使我們從離散組件轉(zhuǎn)向單一集成系統(tǒng)。共封裝光學(xué)技術(shù)(CPO)是業(yè)界的解決方案,該架構(gòu)將芯片重新定義為處理兼光學(xué)I/O引擎。
超大型數(shù)據(jù)中心正面臨性能瓶頸,傳統(tǒng)的芯片到端口連接方式對吞吐量和可擴展性造成了結(jié)構(gòu)性限制。預(yù)計全球?qū)?shù)據(jù)中心容量的需求到2030年將會是現(xiàn)在的三倍以上,使得這一挑戰(zhàn)更加嚴(yán)峻。
業(yè)界的解決方案是共封裝光學(xué)技術(shù)(CPO),這是一種全新架構(gòu),將光學(xué)輸入/輸出(I/O)直接與芯片集成,從而解決距離問題。但這種直接方式又帶來了圍繞熱管理和可維護(hù)性的一系列新的工程障礙。新架構(gòu)是否可行,現(xiàn)在取決于能否掌控應(yīng)對這些核心問題的系統(tǒng)級方法。
01. 為何可插拔光學(xué)技術(shù)正逼近其極限
在AI龐大的算力需求下,成熟的前面板可插拔光學(xué)架構(gòu)已經(jīng)逼近其物理極限。傳統(tǒng)光學(xué)收發(fā)器設(shè)計的固有挑戰(zhàn)是,信號從主板上的專用集成電路(ASIC)通過有損銅導(dǎo)線傳輸?shù)角懊姘迥K,這期間必須跨越很長的電氣距離。在像448Gbps這樣的下一代速度下,推動信號通過這一路徑需要巨大的電能來補償信號隨距離的衰減,這些能量最終以廢熱的形式散失。
龐大的算力消耗導(dǎo)致“I/O功耗瓶頸”,這是一個重大的行業(yè)問題,移動數(shù)據(jù)所需的電力開始比肩處理數(shù)據(jù)所需的電力。這不僅推高運營成本,也使熱管理變得更為復(fù)雜。同時,可插拔模塊的物理尺寸對前面板I/O密度也造成了嚴(yán)格限制。隨著數(shù)據(jù)傳輸率的增加,前面板上可用于添加更多端口的物理空間正在耗盡,使得面板上也出現(xiàn)了一個獨立但同樣致命的帶寬瓶頸。
02. 共封裝光學(xué)技術(shù)和功耗收益
CPO將光學(xué)引擎與主處理器集成在同一基板上,重新定義了光學(xué)收發(fā)器的架構(gòu)。這種緊密集成大幅縮短了電氣路徑,減少了推動信號所需的電力。路徑縮短之后,就不再需要大功率重定時器和其他信號調(diào)節(jié)組件,來滿足長距離銅導(dǎo)線傳輸所需,這可以顯著降低光學(xué)I/O造成的功耗。因此,CPO解決了I/O功耗瓶頸和前面板密度限制問題,顯著提高了用電效率和帶寬。
然而,該集成本身帶來了兩個重大工程障礙:
● 熱管理:因為激光器直接放置在高價值處理器旁邊,這是光學(xué)系統(tǒng)的主要熱源。
● 可維護(hù)性風(fēng)險:因為組件故障可能需要更換整個處理器封裝。
03. 共封裝光學(xué)技術(shù)中的調(diào)制器取舍
CPO的可行性取決于硅光子學(xué),這是一種使用成熟的半導(dǎo)體制造能力將光學(xué)功能集成到芯片上的技術(shù)。該架構(gòu)的核心組件是調(diào)制器,它將電氣數(shù)據(jù)編碼到光中,代表了一項重要的工程取舍。
兩種主要調(diào)制器技術(shù)之間的取舍顯而易見:Mach-Zehnder調(diào)制器(MZM)和微環(huán)調(diào)制器(MRM)。
● Mach-Zehnder調(diào)制器非常穩(wěn)定可靠,但其體積龐大,與CPO的密度目標(biāo)相沖突。
● 微環(huán)調(diào)制器體積小巧,能效高,但對熱波動非常敏感。而放置在靠近發(fā)熱處理器時,這種波動又不可避免。
面對這樣的現(xiàn)實情況,業(yè)內(nèi)主要企業(yè)做出了不同的決策。例如,Broadcom似乎更傾向于使用MZM,而Nvidia則為其CPO應(yīng)用選擇了MRM。
這兩種方法之間的沖突凸顯了一個關(guān)鍵信息:熱管理是任何可行的CPO設(shè)計中都必須克服的核心工程障礙。
04.外部激光源:CPO的系統(tǒng)級解決方案
要解決CPO核心熱管理和可維護(hù)性挑戰(zhàn),最有效的架構(gòu)解決方案是使用外部激光源(ELS),將激光器與CPO分離。Molex已完整實現(xiàn)這一概念并率先推向市場,將CPO 從紙上談兵變?yōu)閷嶋H可部署的現(xiàn)實。
● 解決熱挑戰(zhàn):外部激光源互連系統(tǒng)(ELSIS)是一個完整的解決方案,實現(xiàn)高功率激光器與處理器和光學(xué)引擎的物理分離。通過將激光器置于獨立的可插拔模塊中,直接解決了熱挑戰(zhàn)。該設(shè)計將發(fā)熱最大的負(fù)載與高價值處理器分離,從而簡化了熱管理。
● 降低可維護(hù)性風(fēng)險:除了解決熱問題,模塊化設(shè)計還支持激光模塊的現(xiàn)場便捷維護(hù),從而降低了可維護(hù)性風(fēng)險。ELSIS使用盲插接口,所有光學(xué)和電氣連接都在設(shè)備內(nèi)部進(jìn)行,避免了激光器故障需要更換整個處理器封裝等代價高昂的情況。
● 降低可維護(hù)性風(fēng)險:這種整體方法帶來的最終產(chǎn)品:ELSIS是一款完整的預(yù)制系統(tǒng),包括:電氣和光學(xué)連接器、壓配外殼、可插拔模塊自身,所有組件均設(shè)計為一個有機的整體,支持可擴展的可靠部署。
05. 系統(tǒng)級挑戰(zhàn)的系統(tǒng)級方法
向CPO的轉(zhuǎn)型代表了設(shè)計理念的重大演變,旨在應(yīng)對系統(tǒng)性的熱管理和可維護(hù)性挑戰(zhàn)。要充分發(fā)揮CPO的性能和效率,需要將激光器、光學(xué)器件和互連視為單一的集成系統(tǒng)。
成功實施該架構(gòu)需要在光學(xué)、電氣和機械領(lǐng)域擁有深厚專業(yè)知識的工程合作方,因為任何一個領(lǐng)域的失敗都會影響整個系統(tǒng)。
Molex ELSIS體現(xiàn)了這種系統(tǒng)級方法,降低了風(fēng)險,并提供了下一代數(shù)據(jù)中心不可或缺的可擴展架構(gòu)。