ICC訊 隨著人工智能(AI)和機(jī)器學(xué)習(xí)(ML)工作負(fù)載的爆發(fā)式增長,數(shù)據(jù)中心對(duì)互連帶寬的需求正以前所未有的速度跨越。行業(yè)正從800G(基于單通道112G SerDes)迅速向*1.6T(基于單通道224G SerDes)*演進(jìn)。在這一演進(jìn)過程中,IEEE 802.3dj標(biāo)準(zhǔn)引入了一項(xiàng)決定性的物理層架構(gòu)變革——Symbol Multiplexing(符號(hào)復(fù)用,簡稱 SM)。
1.6TBASE-R PCS transmit data distribution and bit ordering
一、 什么是Symbol Multiplexing?
在以往的以太網(wǎng)標(biāo)準(zhǔn)(如802.3df)中,物理介質(zhì)附件(PMA)子層通常采用位復(fù)用(Bit Multiplexing, BM)技術(shù)。然而,當(dāng)單通道速率達(dá)到224 Gbps時(shí),極短的單位間隔(UI)使得信號(hào)極易受到損耗、反射和符號(hào)間干擾(ISI)的影響,導(dǎo)致物理信道變得異常脆弱。
為了在這種嚴(yán)苛的誤碼環(huán)境下維持鏈路可靠性,IEEE 802.3dj 轉(zhuǎn)向使用 SM-PMA(符號(hào)復(fù)用PMA)。
技術(shù)核心:符號(hào)復(fù)用不再是以“位”為單位進(jìn)行簡單的物理疊加,而是要求PMA能夠識(shí)別RS-FEC(前向糾錯(cuò))的符號(hào)邊界(通常為10位一個(gè)符號(hào))。映射模式:針對(duì)1.6T以太網(wǎng),標(biāo)準(zhǔn)定義了符號(hào)四元組復(fù)用(Symbol-quartet Multiplexing),將來自不同F(xiàn)EC碼字的相鄰10位符號(hào)組成40位的四元組進(jìn)行處理。實(shí)現(xiàn)前提:該技術(shù)依賴于精確的*對(duì)齊標(biāo)記(Alignment Markers)鎖定和去偏(Deskew)*過程,以確保各條PCS通道在進(jìn)入復(fù)用器前已完成邊界對(duì)齊。
Symbol multiplexing from PCS lanes to Physical lanes
二、 為什么符號(hào)復(fù)用能提升FEC性能?
符號(hào)復(fù)用的引入主要是為了解決單通道200G速率下“突發(fā)錯(cuò)誤(Burst Errors)”對(duì)糾錯(cuò)能力的威脅。
抑制錯(cuò)誤擴(kuò)散:在傳統(tǒng)的“位復(fù)用”模式下,單一物理通道上的一個(gè)長突發(fā)錯(cuò)誤會(huì)被分散到多個(gè)FEC符號(hào)周期中。由于RS-FEC每條碼字最多只能糾正15個(gè)符號(hào)錯(cuò)誤,這種錯(cuò)誤的擴(kuò)散極易導(dǎo)致碼字不可糾正,從而引發(fā)鏈路失效。錯(cuò)誤遏制(Error Containment):符號(hào)復(fù)用確保來自單一物理通道的突發(fā)錯(cuò)誤被限制在盡可能少的FEC符號(hào)周期內(nèi)(理想情況下僅為一個(gè)符號(hào))。這種“將雞蛋放在一個(gè)籃子里”的策略,反而保護(hù)了整個(gè)FEC碼字的完整性,顯著提高了糾錯(cuò)成功率。
同一1.6T光模塊在Bit multiplexing和Symbol multiplexing模式下FEC性能
三、 符號(hào)復(fù)用模式下測試光模塊的重要性
符號(hào)復(fù)用雖然為1.6T鏈路提供了魯棒性,但其帶來的變速器(Gearbox)智能性提升也極大地增加了系統(tǒng)復(fù)雜性,使得光模塊的驗(yàn)證變得至關(guān)重要。
1. 規(guī)避“虛假健康”的誤導(dǎo)
在1.6T時(shí)代,單純依靠非成幀(Unframed)的BERT測試(如傳統(tǒng)的PRBS31Q)可能產(chǎn)生嚴(yán)重誤判。資料顯示,某些光模塊在非分幀測試中表現(xiàn)良好(BER達(dá)到10??),但在切換到成幀(Framed)的FEC模式后,會(huì)因?yàn)榫馄鬟^載或符號(hào)對(duì)齊不良產(chǎn)生極長的錯(cuò)誤尾跡。只有在符號(hào)復(fù)用映射(SM)模式下進(jìn)行帶流量的成幀(Framed)測試,才能發(fā)現(xiàn)隱藏在FEC層面的突發(fā)錯(cuò)誤。
2. 驗(yàn)證復(fù)雜的鏈路訓(xùn)練(ILT)
1.6T以太網(wǎng)建議引入跨子層鏈路訓(xùn)練(ILT)。在這種模式下,ASIC與光模塊之間需要通過復(fù)雜的握手協(xié)議來自主優(yōu)化發(fā)射器參數(shù)。如果光模塊在符號(hào)復(fù)用邏輯上存在細(xì)微缺陷,可能導(dǎo)致ILT無法完成,或者建立的連接缺乏足夠的性能裕量(Margin),導(dǎo)致鏈路頻繁閃斷(Link Flap)。(最終版本可能會(huì)有變化,新的概念PSU(Path Startup)會(huì)涵蓋RTS(Ready to Send)和ILT(inter-sublayer link training))
3. 應(yīng)對(duì)極其嚴(yán)苛的散熱與信號(hào)穩(wěn)定性
1.6T光模塊(如OSFP1600)的功耗預(yù)計(jì)將達(dá)到30W甚至更高(基于3nm制程技術(shù)的硅光模塊可低至22W左右),這對(duì)物理層的信號(hào)穩(wěn)定性提出了巨大挑戰(zhàn)。在測試中,必須模擬真實(shí)的符號(hào)復(fù)用環(huán)境,通過插入FEC符號(hào)錯(cuò)誤、L1告警(如LOAMPS)或進(jìn)行動(dòng)態(tài)偏移(Dynamic Skew)測試,來驗(yàn)證模塊在高溫和電氣噪聲下的極限抗干擾能力。
總結(jié)
符號(hào)復(fù)用(Symbol Multiplexing)是以太網(wǎng)從“位處理”時(shí)代邁向“符號(hào)處理”時(shí)代的標(biāo)志,是實(shí)現(xiàn)1.6T超高速傳輸?shù)?strong>技術(shù)通行證。對(duì)于光模塊廠商和數(shù)據(jù)中心運(yùn)營商而言,傳統(tǒng)的BER測試已不足以支撐可靠性驗(yàn)證。必須利用如VIAVI 公司的ONE LabPro等先進(jìn)測試平臺(tái),在真實(shí)的符號(hào)映射和FEC成幀域內(nèi)進(jìn)行深入分析,方能確保1.6T網(wǎng)絡(luò)在AI時(shí)代的穩(wěn)定運(yùn)行。
ONE LabPro,Controller + ONE 1600
比喻理解: 從“散裝玻璃杯運(yùn)輸”(BM)到“獨(dú)立防震包裝箱”(SM)我們可以將 1.6T 的數(shù)據(jù)傳輸比作在一輛極速顛簸的卡車上運(yùn)輸“玻璃杯”(數(shù)據(jù)位)。為了保證玻璃杯碎了能修好,我們有一位“修復(fù)師”(FEC 糾錯(cuò)算法)。
為什么必須要在SM模式下測試:
邏輯性崩潰:SM 模式要求系統(tǒng)必須精準(zhǔn)識(shí)別“包裝盒”的邊界(符號(hào)對(duì)齊)。如果光模塊的Gearbox 邏輯有微小偏差,哪怕只錯(cuò)位 1 個(gè)位,所有的“包裝盒”都會(huì)被剪錯(cuò)位。
測試盲區(qū):如果你用舊的BM測試,你只是在數(shù)碎了多少個(gè)杯子(Bit BER),這會(huì)給你一種“虛假健康”的幻覺。只有在 SM 映射模式下進(jìn)行成幀測試,你才能驗(yàn)證:
1. 模塊的“封盒機(jī)器”(邏輯映射)是否工作正常。
2. 它是否真的能利用“獨(dú)立包裝”來抗震(驗(yàn)證 FEC 糾錯(cuò)后的真實(shí)性能)。
總結(jié)
對(duì)于 1.6T 高速光模塊,基于 Bit Multiplexing 的測試結(jié)果是具有欺騙性的,因?yàn)樗雎粤?224G 架構(gòu)中最重要的“符號(hào)邏輯層”。不測 Symbol Multiplexing,就相當(dāng)于檢查了一臺(tái)超音速客機(jī)的發(fā)動(dòng)機(jī)(位流),卻完全沒有檢查它的增壓密封艙(符號(hào)對(duì)齊與 FEC 增益),這在實(shí)際 AI 網(wǎng)絡(luò)中是極其危險(xiǎn)的。