Lợi ích của bộ thu phát có thể cắm được: Tại sao nên chọn Quang học mô-đun

Apr 20, 2026|

Tại OFC 2025, người đồng sáng lập Arista, Andy Bechtolsheim, đã lập luận rằng các mô-đun truyền động-tuyến tính có thể phù hợp với hệ thống quang học đóng gói chung về hiệu suất năng lượng ở 1600G, do đó, khó có thể biện minh cho độ phức tạp tăng thêm của CPO. Vài tuần sau, Meta công bố dữ liệu thử nghiệm ECOC cho thấy CPO đạt được MTBF khoảng 2,6 triệu giờ thiết bị-so với 0,5 đến 1 triệu giờ của mô-đun thông thường. Hai bộ dữ liệu đáng tin cậy, kết luận trái ngược nhau. Cuộc tranh luận về lợi ích của bộ thu phát có thể cắm được so với quang tử tích hợp không còn mang tính học thuật nữa; nó đang định hình chu kỳ mua sắm ngay bây giờ (Blog APNIC).

Chúng tôi sản xuất và vận chuyển các mô-đun này. Điều đó có nghĩa là chúng tôi có lợi ích thương mại trong cuộc trò chuyện này và chúng tôi sẽ không giả vờ khác. Tuy nhiên, chúng tôi cũng tiến hành thử nghiệm khả năng tương thích trên các nền tảng chuyển đổi và hỗ trợ khách hàng khắc phục các lỗi triển khai, điều đó có nghĩa là chúng tôi biết được đâu là quang học mô-đun thực sự có hiệu quả và đâu là không.

Phép toán về khả năng phục vụ mà các nhà cung cấp đánh giá cao

Một lỗiMô-đun DD 400G QSFP{1}}DDđi ra trong vòng chưa đầy hai phút. Kỹ thuật viên kiểm tra ống nối, làm sạch hoặc thay thế nó, kiểm tra số đọc DDM và liên kết đã hoạt động trở lại. Tổng bán kính vụ nổ: một cổng.

 

CPO thay đổi phương trình đó. Khi công cụ quang học nằm bên trong gói chuyển đổi, lỗi lớp{1}}quang tử có thể buộc phải thay thế toàn bộ bo mạch hoặc khung máy. Ngay cả các thiết kế sử dụng nguồn laser bên ngoài vẫn để lại các thành phần quang tử-trường-không thể thay thế được coi là các điểm lỗi duy nhất. Đây không phải là mối lo ngại giả định; đó là lý do chính khiến các nhà khai thác siêu quy mô tiếp tục xem xét lại sự cân bằng-kiến trúc.

 

Dữ liệu thực địa làm cho trường hợp cụ thể hơn. Trên hơn 2.600 trung tâm dữ liệu, ô nhiễm đầu nối chiếm khoảng 67% lỗi liên kết quang, theo tiêu chuẩn kiểm tra bề mặt sợi quang IEC 61300-3-35 (Wikipedia - IEC 61300). Một hạt 2-micromet trên một mặt cuối của một chế độ-có thể cản trở 40% tín hiệu quang. Đây không phải là những thất bại nặng nề. Chúng tạo ra các lỗi bit không liên tục và suy giảm thông lượng vốn rất khó phân biệt nếu không có-giám sát chẩn đoán trên mỗi cổng. Trong kiến ​​trúc mô-đun có thể thay thế nóng, bạn lấy đơn vị nghi ngờ, kiểm tra theo phạm vi và giải quyết. Trong thiết kế CPO, sự ô nhiễm tương tự xảy ra trong quá trình sản xuất sẽ được nhúng vào.

Network technician performing on-site maintenance on a 400G QSFP-DD pluggable transceiver for quick data center link restoration

Khả năng phục hồi nhiệt

 

Đợt nắng nóng ở Arizona năm 2024 đã khiến ngôi nhà này bị ảnh hưởng trên quy mô lớn. Các trung tâm dữ liệu chạy mô-đun làm mát-thụ động có tỷ lệ hỏng hóc là 23% trong thời gian nhiệt độ tăng đột biến.

2,3 triệu USD

 

Chi phí thay thế khẩn cấp tránh được ở các cơ sở bị ảnh hưởng trong thời gian nhiệt độ tăng đột biến nhờ các thiết bị được trang bị-TEC.

 

Các cơ sở sử dụng-thiết bị được trang bị TEC không ghi nhận lỗi nào. Chi phí cao hơn cho mỗi-mô-đun là khoảng 80 USD. Chi phí thay thế khẩn cấp tránh được cho các cơ sở bị ảnh hưởng: khoảng 2,3 triệu USD. Khi chúng tôi chỉ định tính năng quản lý nhiệt cho khách hàng trong môi trường có-môi trường xung quanh cao, đây là trường hợp tham chiếu mà chúng tôi bắt đầu.

 

MSA thực sự đảm bảo điều gì (và xác thực EEPROM lặng lẽ loại bỏ)

 

Việc tuân thủ Thỏa thuận nhiều nguồn được cho là có nghĩa là QSFP28 từ bất kỳ nhà cung cấp nào sẽ rơi vào bất kỳ lồng tuân thủ MSA- nào. Đối với hoạt động mua sắm, điều này dẫn đến đòn bẩy tìm nguồn cung ứng từ nhiều{4}}nhà cung cấp, áp lực về giá cả cạnh tranh và sự bảo vệ khỏi sự phụ thuộc vào một-nhà cung cấp. Một nhà điều hành dịch vụ hậu cần đã thay thế mô-đun 10G mang nhãn hiệu OEM-bằng bên-thứ baCác lựa chọn thay thế tuân thủ MSA-trên bảy cơ sở và cắt giảm chi tiêu thu phát khoảng 2,1 triệu USD trên mức chiết khấu 68% cho kênh hiện có.

 

Khoảng cách thực tế giữa thông số kỹ thuật và trường thuộc về xác thực EEPROM. Cisco, Juniper và Arista đều ghi mã nhận dạng độc quyền vào các địa chỉ bộ nhớ-cụ thể của nhà cung cấp trên SFP EEPROM. Khi bộ chuyển đổi máy chủ đọc mã không được nhận dạng khi khởi động, nó có thể ngăn chặn việc đo từ xa DDM, ghi lại các cảnh báo liên tục hoặc vô hiệu hóa hoàn toàn cổng. MSA xác định giao diện điện và quang, không phải bắt tay phần sụn ở phía máy chủ (Wikipedia - Hệ số dạng nhỏ-Có thể cắm được)

Chúng tôi giải quyết vấn đề này hàng ngày. Đội ngũ kỹ thuật của chúng tôi duy trìhồ sơ tương thích được mã hóa cho các nền tảng chuyển đổi chínhbao gồm dòng Cisco Nexus 9300, Arista 7060CX và dòng Huawei CE.

// KIỂM TRA EEPROM DUMP

ĐỊA CHỈ 0xA0:                               0x43 0x49 0x53 0x43 0x4f
ĐỊA CHỈ 0x94: AUTH_VALID
DDM ĐỌC: -6,2 dBm

Tuy nhiên, chỉ viết mã thôi thì không đảm bảo đầy đủ chức năng. Quá trình triển khai dịch vụ tài chính đã dạy chúng tôi rằng: 200 mô-đun LR SFP-10G{4}}LR từ một nhà cung cấp đã vượt qua thử nghiệm liên kết, nhưngGiám sát DDMtab hiển thị màu xám trên công tắc máy chủ. Mười tám tháng sau, khi tình trạng suy giảm nguồn điện TX liên quan đến tuổi-bắt đầu ảnh hưởng đến các liên kết, nhóm vận hành không có tín hiệu cảnh báo sớm-sớm nào. Việc thay thế số lượng lớn bắt buộc có giá khoảng 47.000 USD cộng với ba ngày bảo trì luân phiên. Các mô-đun đã hoạt động. Việc giám sát không. Khoảng cách đó là nơi các quyết định mua sắm thực sự tồn tại.

 

Mở rộng quy mô mà không vượt quá ngân sách

 

Nhà cung cấp đám mây có kích thước-trung bình chỉ tạo ra các liên kết lên lá- gáy cần thiết khi khởi chạy thay vì-triển khai trước toàn bộ-mật độ 100G trên mỗi cổng. Tiết kiệm CapEx ban đầu: khoảng 800.000 USD. Mười tám tháng sau, khi lưu lượng truy cập tăng lên đòi hỏi phải có thêm đường lên, nhóm đã cài đặt các mô-đun tăng dần mà không cần thay đổi phần cứng.

 

Cloud provider data center aisle showing incremental deployment of 100G optical transceivers for modular network expansion

 

Điểm uốn kinh tế hẹp hơn so với tài liệu của nhà cung cấp ngụ ý. Thiết bị có ổ cắm quang mô-đun có mức giá cao hơn từ 10 đến 25% so với các thiết bị-quang cố định tương đương, dựa trên mức giá được công bố của ba nhà cung cấp bộ chuyển mạch lớn. Khoản phí bảo hiểm đó sẽ phục hồi khi xác suất thay đổi cấu hình trong vòng đời thiết bị vượt quá khoảng 30%. Việc làm mới khuôn viên doanh nghiệp kéo dài từ 5 đến 7 năm hầu như luôn vượt qua ngưỡng đó. Các cụm HPC được xây dựng có mục đích với cấu trúc liên kết cố định và thường không có tuổi thọ 3 năm.

 

QSFP-DD khả năng tương thích ngượcthêm giá trị mua sắm hữu hình. Bộ chuyển mạch có lồng QSFP-DD chạy các mô-đun QSFP28 ở tốc độ 100G hiện nay và chấp nhậnMô-đun 400G QSFP-DD DR4 hoặc FR4sau này mà không cần nâng cấp xe nâng. Đây không phải là sự kiểm chứng-về mặt lý thuyết trong tương lai. Đây là một quyết định-mục hàng nhằm bảo vệ CapEx hiện tại trong khi vẫn duy trì đường dẫn nâng cấp được ghi lại.

 

Nơi chúng tôi khuyên khách hàng không nên mua mô-đun

 

Sự trung thực về mặt trí tuệ có nghĩa là thừa nhận những tình huống mà kiến ​​trúc này bị thua. Dữ liệu ECOC của Meta đo được các mô-đun 800G tiêu thụ khoảng 15W mỗi cổng so với CPO ở mức xấp xỉ 5,4W cho băng thông tương đương, giảm 64% điện năng. Ở quy mô siêu lớn, nơi một cơ sở duy nhất chạy hàng chục nghìn liên kết quang, vùng delta đó sẽ tăng thêm công suất hoạt động và tải làm mát lên tới megawatt.

 

Ngoài ra còn có mức trần chi phí cố định-mỗi-bit. Phân tích ngành chỉ ra rào cản khoảng 1 Gbps-mỗi{{5} đô la mà việc đóng gói mô-đun, trình kết nối và thử nghiệm trên mỗi đơn vị-đơn vị khiến cho cấu trúc khó bị phá vỡ. Ở mật độ chuyển mạch 51,2T, diện tích bảng điều khiển-phía trước trở thành một hạn chế về mặt vật lý: đơn giản là không có đủ không gian lồng để chiếu sáng mọi làn SerDes ở băng thông tối đa bằng các mô-đun riêng biệt.

Những hạn chế này là có thật. Họ cũng mô tả một hồ sơ triển khai cụ thể: các cụm đào tạo AI có mật độ cực kỳ-cao{2}} với phạm vi tiếp cận dưới-2- mét, cấu trúc liên kết có thể dự đoán được và các nhóm vận hành được chuẩn bị để quản lý các đường dẫn quang không thể phục vụ được. Hồ sơ đó đại diện cho một phân khúc nhỏ và đang phát triển nhưng vẫn còn hẹp trong tổng cơ sở hạ tầng mạng. Đối với mọi thứ khác, khả năng phục vụ và tính linh hoạt trong tìm nguồn cung ứng của các mô-đun rời rạc vẫn là con đường có rủi ro thấp hơn.

Chọn theo bối cảnh triển khai

 

Phần lõi của trung tâm dữ liệu-ở mức 400G, trong đó số lượng cổng thay đổi theo nhu cầu của người thuê và nhân viên vận hành xoay mô-đun thường xuyên, vẫn nằm vững chắc trong lãnh thổ mô-đun. Các liên kết đô thị DCI chạy 400ZR nhất quán ở hệ số dạng QSFP{4}}DD đã loại bỏ hiệu quả các hộp phát đáp độc quyền cho khoảng cách dưới 120 km. Mạng lưới chi nhánh và khuôn viên doanh nghiệp thậm chí không phải là một điều gần gũi; chu kỳ làm mới dài, môi trường chuyển đổi nhiều-nhà cung cấp và-chuyên môn quang học tại chỗ bị hạn chếtrường-mô-đun thu phát có thể hoán đổisự lựa chọn hoạt động hợp lý duy nhất.

 

High-density network switch front panel with multiple QSFP-DD ports for flexible AI and storage fabric connectivity

 

Quyết định mang tính sắc thái là kết nối AI/ML. Đối với các liên kết GPU-với-GPU dưới 2 mét trong đó cấu trúc liên kết được cố định khi triển khai và không bao giờ thay đổi, CPO hoặc quang học trên bo mạch-cuối cùng có thể biện minh cho sự cân bằng về khả năng sử dụng-. Đối với các mạng quản lý, cơ cấu lưu trữ và đường dẫn bắc{7}}nam còn lại trong cùng các cơ sở đó, các mô-đun riêng biệt vẫn giữ nguyên mặc định.

 

Một lưu ý cụ thể đối với LPO: quang học truyền động-tuyến tính duy trì hệ số dạng quen thuộc nhưng yêu cầu ASIC chuyển đổi có-mặt trước tương tự được thiết kế có mục đích{2}}. Cho đến nay, chúng tôi đã thử nghiệm các mẫu đánh giá LPO trên hai nền tảng chuyển mạch và xác nhận rằng không thể giả định khả năng tương thích của máy chủ. Trước khi chỉ định LPO trong kế hoạch triển khai, hãy hỏi nhà cung cấp mô-đun của bạn xem họ đã xác thực nền tảng nào. Nếu họ không thể đưa ra một danh sách cụ thể, điều đó sẽ cho bạn biết những điều bạn cần biết.

 

Điều này có ý nghĩa gì đối với chu kỳ mua sắm tiếp theo của bạn

 

Mô-đun DD 800G OSFP và QSFP-DDhiện đang được vận chuyển. 1.6Hệ số dạng chữ T đang được tiêu chuẩn hóa tích cực. CPO, theo các mốc thời gian đáng tin cậy nhất trong ngành, sớm nhất sẽ không thấy việc triển khai số lượng lớn trước năm 2028. Đường cong chi phí quang tử silicon đang bị nén lại, nhưng việc nén đó mang lại lợi ích cho các thiết kế mô-đun cũng giống như các thiết kế tích hợp.

 

Đối với phần lớn các mạng đang được lên kế hoạch và mua sắm hiện nay, kiến ​​trúc bộ thu phát có thể cắm mang lại kết nối quang-rủi ro thấp nhất, hoạt động linh hoạt nhất hiện có. Câu hỏi đặt ra không phải là liệu quang học mô-đun có lỗi thời hay không. Câu hỏi đặt ra là liệu hoạt động triển khai cụ thể của bạn có nằm trong nhóm trường hợp sử dụng hẹp trong đó các giải pháp thay thế đã đủ hoàn thiện để đảm bảo sự cân bằng-của chúng hay không. Nếu bạn đang đánh giá ranh giới đó cho bản dựng sắp tới,đội ngũ kỹ thuật của chúng tôicó thể cùng bạn đưa ra quyết định.

 

 
Câu hỏi thường gặp

Câu hỏi: Bộ thu phát có thể cắm được có tốt hơn bộ quang học đóng gói chung không?

Đáp: Đối với các hoạt động triển khai yêu cầu khả năng phục vụ tại hiện trường, tìm nguồn cung ứng từ nhiều{0}}nhà cung cấp và mở rộng quy mô theo cấp số nhân, quang học mô-đun có những lợi thế rõ ràng. CPO cung cấp công suất trên mỗi-cổng thấp hơn ở mật độ siêu quy mô nhưng lại hy sinh-khả năng thay thế tại chỗ.

Hỏi: Mô-đun tuân thủ MSA của bên thứ ba có thể tiết kiệm được bao nhiêu so với giá OEM?

Đáp: Mức tiết kiệm thay đổi tùy theo nền tảng và khối lượng, nhưng các hoạt động triển khai được ghi nhận đã giảm từ 40 đến 65% so với giá niêm yết OEM sau khi xác minh khả năng tương thích.

Câu hỏi: Rủi ro lớn nhất với hệ thống quang học có thể cắm được là gì?

Đáp: Ô nhiễm đầu nối gây ra phần lớn các lỗi tại hiện trường. Kiểm tra bề mặt cuối phù hợp theo IEC 61300-3-35 và chọn mô-đun có báo cáo DDM chức năng là hai biện pháp giảm nhẹ hiệu quả nhất.

Gửi yêu cầu