Công nghệ thu phát 800G: OSFP và QSFP-DD800

Apr 21, 2026|

Nhóm mạng mà chúng tôi hỗ trợ đã triển khai ba mươi-hai mô-đun QSFP-DD800 DR8 trong bộ chuyển mạch cột sống mới vào quý trước. Mỗi cổng đều vượt qua thử nghiệm BER trong phòng thí nghiệm ở nhiệt độ băng ghế tiêu chuẩn. Sau đó, họ tải tất cả 32 cổng đang được lưu thông sản xuất ở mật độ đầy đủ trên giá và nhiệt độ thùng vượt qua 80 độ trong vòng 40 phút. Nguyên nhân cốt lõi không phải là lỗi mô-đun. Đó là mức dự trữ nhiệt được xây dựng dựa trên bảng dữ liệu, công suất tiêu biểu là 14W trên mỗi cổng, trong khi mức tiêu thụ thực tế khi tải liên tục đạt từ 17 đến 19W. Ở mức 19W trên 32 cổng, công tắc đó đang cố gắng loại bỏ hơn 600 watt nhiệt chỉ từ quang học. Đây là loại lỗ hổng khiến việc lựa chọn công nghệ thu phát 800G trở thành một vấn đề kỹ thuật hệ thống hơn là một bài tập về bảng thông số kỹ thuật.

 

Nguyên nhân cốt lõi không phải là lỗi mô-đun. Đó là mức dự trữ nhiệt được xây dựng dựa trên bảng dữ liệu, công suất tiêu biểu là 14W trên mỗi cổng, trong khi mức tiêu thụ thực tế khi tải liên tục đạt từ 17 đến 19W. Ở mức 19W trên 32 cổng, công tắc đó đang cố gắng loại bỏ hơn 600 watt nhiệt chỉ từ quang học. Đây là loại lỗ hổng khiến việc lựa chọn công nghệ thu phát 800G trở thành một vấn đề kỹ thuật hệ thống hơn là một bài tập về bảng thông số kỹ thuật.

 

Nền tảng chuyển mạch nào bạn đang triển khai, cơ sở hạ tầng làm mát của bạn được xây dựng như thế nào, kết cấu của bạn chạy InfiniBand hay Ethernet, liệu lộ trình của bạn có bao gồm 1,6T trong vòng ba mươi{1}}sáu tháng hay không: không có biến nào trong số đó xuất hiện trên biểu dữ liệu mô-đun và tất cả các biến đó đều xác định liệu OSFP hay QSFP-DD800 có phải là hệ số dạng chính xác cho hoạt động triển khai của bạn hay không.

 

Thermal hotspot analysis of a high-density 800G switch chassis showing heat dissipation from QSFP-DD800 modules under sustained network traffic load

 

Khoảng cách nhiệt: Khoảng cách giữa bảng thông số kỹ thuật và khung chuyển đổi

 

Quan điểm thông thường của ngành là OSFP cung cấp hiệu suất nhiệt tốt hơn vì vỏ lớn hơn về mặt vật lý. Chiều cao vỏ OSFP là 13,13 mm so với 8,5 mm của QSFP{2}}DD có nghĩa là gần gấp đôi diện tích tiếp xúc của tản nhiệt và đối với quang học kết hợp 800G có công suất 25W trở lên, âm lượng tăng thêm đó là một yêu cầu khó khăn hơn là ưu tiên.

"Nhiệt độ khi tải của vỏ máy tương quan chặt chẽ hơn với kiến ​​trúc luồng không khí của nhà cung cấp thiết bị chuyển mạch so với việc mô-đun là OSFP hay QSFP-DD."

Bức tranh đó sẽ thay đổi khi bạn xem xét việc làm mát ở cấp độ hệ thống thay vì đóng gói ở cấp độ mô-đun. Cisco đã tiến hành trình diễn công khai khung gầm 1RU 25,6T QSFP-DD800 tiêu thụ 30W mỗi mô-đun trên tất cả các cổng, cao hơn nhiều so với mức mà bất kỳ bộ thu phát DR8 hoặc FR4 hiện tại nào thu được ([Cisco]). Với hình dạng lồng tản nhiệt bên phải và thiết kế đường cong quạt, vỏ QSFP{1}}DD800 có thể xử lý các mức công suất ngày nay một cách có giới hạn. Việc nó có xử lý được ngày mai hay không phụ thuộc vào vị trí của các thiết bị cắm kết hợp và LPO kết thúc trên đường cong sức mạnh và hầu hết các bài viết so sánh đều bỏ qua phần phân tích đó.

 

Chúng tôi chạy cả hai hệ số dạng này thông qua quá trình xác thực giảm nhiệt trong quá trình đánh giá chất lượng, thử nghiệm trên toàn bộ cổng trên các nền tảng bao gồm dòng Arista 7800-và khung gầm dòng Cisco 8000-. Theo kinh nghiệm của chúng tôi, nhiệt độ trong trường hợp đang tải tương quan chặt chẽ hơn với kiến ​​trúc luồng không khí của nhà cung cấp thiết bị chuyển mạch so với việc mô-đun là OSFP hay QSFP-DD. Mô-đun OSFP trong khung thông gió kém có thể chạy nóng hơn QSFP-DD800 trong khung được thiết kế cho quang học công suất cao. Chúng tôi đã tận mắt chứng kiến ​​điều này. Để có cái nhìn sâu hơn về cách công suất mô-đun tác động đến quy hoạch nhiệt tổng thể của giá đỡ, [phân tích xu hướng tiêu thụ năng lượng của máy thu phát quang]bao gồm các con số chi tiết hơn.

 

Bẫy biến thể hàng đầu OSFP

 

Các nhóm mua sắm đặt hàng mô-đun OSFP 800G lần đầu tiên thường tập trung vào loại quang học (DR8, SR8, FR4) và phạm vi tiếp cận. Biến thể cơ khí hiếm khi lọt vào danh sách kiểm tra của đơn đặt hàng và đó là nơi xảy ra những sai lầm đắt giá. OSFP có ba dạng vật lý: Finned Top (IHS) với các cánh tản nhiệt bằng nhôm tích hợp cho lồng chuyển mạch, Flat Top (RHS) với bề mặt nhẵn được thiết kế cho tản nhiệt cưỡi NIC và Closed Top là một dạng kết hợp được tìm thấy trong các nền tảng cụ thể của Cisco. Chúng không thể thay thế cho nhau.

 

Comparison of 800G OSFP mechanical variants including Finned Top Integrated Heat Sink (IHS) and Flat Top Riding Heat Sink (RHS) form factors

 

Khả năng tương thích là cơ học, không phải quang học. Một OSFP 800G có Finned Top và một OSFP có Flat Top có thể có thông số quang học giống nhau, bước sóng giống nhau, xếp hạng phạm vi tiếp cận giống nhau và về mặt vật lý, Finned Top sẽ không nằm trong lồng ConnectX-7. Chúng tôi đã xử lý một khoản hoàn trả vào năm ngoái trong đó một nhà tích hợp hệ thống đã đặt hàng 200 đơn vị Finned Top OSFP để triển khai bao gồm các NIC chỉ dành cho RHS. Mọi mô-đun đều hoàn hảo về mặt quang học. Không ai trong số họ phù hợp.

 

Biến thể hàng đầu nào hoạt động trong thiết bị nào là thứ chúng tôi xác minh trong quá trình mã hóa EEPROM của mình. Các mô-đun OSFP của FB-LINK đi kèm với cấu hình dành riêng cho nền tảng- đã được xác thực dựa trên bộ chuyển đổi mục tiêu hoặc NIC. Các nền tảng Cisco, Arista, Juniper, Dell, HPE và NVIDIA/Mellanox ConnectX đều nằm trong ma trận tương thích đã được thử nghiệm của chúng tôi. Nếu bạn cung cấp mẫu khung và phiên bản chương trình cơ sở tại thời điểm đặt hàng, chúng tôi sẽ giải quyết câu hỏi IHS/RHS trước khi vấn đề đó trở thành vấn đề hậu cần.

 

QSFP-DD800 mang lại lợi thế về cấu trúc ở đây dành cho các nhóm mua sắm quản lý môi trường nhiều-nhà cung cấp. Có một hình dạng vật lý. Nó phù hợp với mọi lồng QSFP-DD từ bốn thế hệ trở lại đây, từ [QSFP28 đến QSFP56 đến 400G QSFP-DD]. Không có sự mơ hồ về biến thể hàng đầu, không có chú thích cuối trang về khả năng tương thích lồng. Đối với các tổ chức điều hành các nhà cung cấp thiết bị chuyển mạch hỗn hợp trên nhiều cơ sở, tính đồng nhất đó giúp giảm đáng kể bề mặt lỗi mua sắm.

 

LPO thay đổi phương trình hệ số dạng như thế nào

 

Cho đến năm 2024, lập luận về công suất cho OSFP rất đơn giản: DSP bên trong mô-đun 800G truyền thống tự tiêu thụ 6 đến 8 watt, đẩy tổng công suất mô-đun lên trên 14W và đôi khi vượt quá 20W. Trần nhiệt cao hơn của OSFP đã đáp ứng được điều đó. Khi chúng tôi chỉ định các mô-đun dựa trên DSP{8}}để triển khai cột sống ở mật độ đầy đủ, mức trợ cấp nhiệt trên mỗi-cổng là hạn chế đầu tiên mà chúng tôi kiểm tra, chứ không phải ngân sách quang học.

 

Quang học có thể cắm tuyến tính loại bỏ hoàn toàn DSP khỏi mô-đun, chuyển điều hòa tín hiệu sang SerDes của công tắc ASIC

. Kết quả là các mô-đun LPO tiêu thụ điện năng dưới 8,5W, gần bằng một nửa công suất so với các mô-đun tương đương dựa trên DSP ([OIF]). Ở mức công suất đó, trần nhiệt 12W của QSFP-DD800 không còn là hạn chế nữa mà bắt đầu ở mức đủ. Lập luận nhiệt tình ủng hộ OSFP trong lịch sử sẽ yếu đi đáng kể khi LPO bước vào cuộc tranh luận.

 

Ngày nay, không phải tất cả các nền tảng chuyển mạch đều hỗ trợ chế độ truyền động tuyến tính và con số hỗ trợ này nhỏ hơn so với thông báo của nhà cung cấp có thể đề xuất. Chúng tôi đã xác thực các kết hợp mô-đun ASIC{1}}cụ thể cho hoạt động LPO và một số nền tảng tuyên bố rằng tính sẵn sàng của LPO trong hoạt động tiếp thị của họ vẫn chưa hỗ trợ chương trình cơ sở ổn định cho nó. Nếu bạn đang đánh giá công nghệ thu phát 800G cho kết cấu mạng AI và LPO là một phần của kế hoạch, thì câu hỏi không phải là "mô-đun này có hoạt động không" mà là "mô-đun này có hoạt động với bản sửa đổi chương trình cơ sở và silicon chuyển đổi cụ thể của tôi không." Chúng tôi có thể trả lời điều đó đối với các nền tảng mà chúng tôi đã thử nghiệm. Hãy gửi cho chúng tôi mẫu bộ chuyển đổi của bạn và chúng tôi sẽ cho bạn biết liệu LPO có khả thi hay không hoặc liệu bạn có cần mô-đun dựa trên DSP{6}}cho vị trí đó hay không.

 

Khi QSFP-DD800 là lựa chọn sai lầm

 

Mọi bài viết của đối thủ cạnh tranh đều kết thúc bằng câu "điều đó phụ thuộc vào nhu cầu của bạn." Đây là nơi chúng tôi sẽ nói cụ thể hơn.

 

QSFP-DD800 là hệ số dạng sai nếu bạn đang xây dựng cụm NVIDIA InfiniBand NDR hoặc XDR trường xanh. Hệ sinh thái ConnectX-7 và Quantum{11}}2 được thiết kế dựa trên OSFP. Các cổng HCA là OSFP. Các cổng chuyển đổi là OSFP. Danh sách quang học đủ tiêu chuẩn của NVIDIA chủ yếu là OSFP. Việc buộc QSFP-DD vào hệ sinh thái này sẽ gây ra chi phí bộ điều hợp, làm phức tạp thêm hoạt động hỗ trợ của nhà cung cấp và khiến bạn nằm ngoài cấu trúc liên kết triển khai đã được xác thực. Các mô-đun 800G OSFP của FB-LINK được thử nghiệm với bộ chuyển mạch NDR NVIDIA Quantum-2 và bộ điều hợp ConnectX-7 vì lý do chính xác này: Các loại vải đào tạo InfiniBand AI không chấp nhận sự mơ hồ về khả năng tương tác.

Cơ sở hạ tầng làm mát bằng chất lỏng-có sự khác biệt nhưng không kém phần rõ ràng. Trong các tủ loại Blackwell-kín không có luồng khí từ trước-đến-sau, mô-đun Finned Top OSFP nằm bên trong buồng cách nhiệt hiệu quả. Các cánh tản nhiệt được thiết kế để tản nhiệt thông qua không khí cưỡng bức không có không khí để hoạt động. Nhiệt độ vỏ trong cấu hình này có thể vượt quá 85 độ, đẩy nhiệt độ tiếp giáp DSP lên trên giới hạn định mức và gây ra hiện tượng trôi bước sóng laser biểu hiện dưới dạng các đột biến BER không liên tục, một loại lỗi trông ngẫu nhiên trong nhật ký nhưng có nguyên nhân cốt lõi là nhiệt nhất quán.

Giải pháp là các mô-đun OSFP{0}}RHS được kết hợp với làm mát bằng tấm lạnh, trong đó bề mặt mô-đun phẳng tiếp xúc nhiệt trực tiếp với vòng chất lỏng thông qua vật liệu giao diện nhiệt. Môi trường làm mát-ngâm chìm yêu cầu vỏ kín có khả năng kháng hóa chất đối với chất lỏng điện môi, áp suất-được định mức ít nhất là 0,2 MPa theo hướng dẫn của OSFP MSA. Nếu việc triển khai của bạn bao gồm các giá đỡ ngâm, hãy xác nhận rằng thông số vật liệu và độ kín của nhà cung cấp mô-đun của bạn đáp ứng các yêu cầu này trước khi đặt hàng số lượng lớn.

 

Ngược lại, QSFP-DD800 là lựa chọn chính xác và thường vượt trội hơn rõ ràng khi bạn nâng cấp kết cấu cột sống lá-Ethernet 400G hiện có. Khả năng tương thích ngược với lồng QSFP28, QSFP56 và 400G QSFP-DD nghĩa là bạn có thể chạy các cổng tốc độ-hỗn hợp trong cùng một khung trong quá trình di chuyển theo giai đoạn. Không cần hoán đổi lồng, không có thẻ chuyển đổi, không cần thay đổi nhà máy cáp. Đối với trung tâm dữ liệu doanh nghiệp chạy bộ chuyển mạch Cisco hoặc Arista Ethernet với cơ sở hạ tầng QSFP{12}}DD hiện có, mô-đun QSFP{13}}DD800 cung cấp lộ trình di chuyển giúp bảo vệ khoản đầu tư trước đó.

Những thất bại không xuất hiện trong thử nghiệm trong phòng thí nghiệm

67% phiếu báo lỗi mô-đun thu phát 800G kết thúc với cùng một nguyên nhân cốt lõi: đầu nối bị nhiễm bẩn. Con số đó xuất phát từ phân tích lỗi trong ngành đối với 347 sự cố triển khai trong đó bản thân các mô-đun đã được kiểm tra đầy đủ chức năng sau khi làm sạch mặt cuối sợi quang. Các hạt nhỏ tới 2 micron, không thể nhìn thấy bằng mắt thường, có thể chặn đủ tín hiệu quang để đẩy một liên kết xuống dưới ngưỡng độ nhạy của máy thu PAM4.

 

Ở mức 53GBaud mỗi làn với tín hiệu PAM4, giới hạn tổn thất do chèn do đầu nối-gây ra chỉ bằng một nửa so với mức 400G. Một sự kiện nhiễm bẩn gây ra sự cố điện năng nhỏ ở 400G sẽ trở thành cơn bão lỗi CRC ở 800G. Việc khắc phục không tốn kém: các quy trình kiểm tra và làm sạch thích hợp phù hợp với quy trình IEC 61300-3-35. Nhưng nó cần phải được ghi vào quy trình triển khai chứ không phải được coi là việc cần làm sau đó.

info-913-685

 

Vấn đề phổ biến thứ hai mà chúng tôi gặp phải là giảm nhiệt khi toàn bộ cảng hoạt động. Nhóm mua sắm chỉ định các mô-đun theo loại quang học (DR8, FR4, SR8) mà không xác nhận mức trợ cấp nhiệt cho mỗi- cổng của khung máy khi mọi khe cắm đều được lắp đặt. Một công tắc làm mát thoải mái 16 cổng được tải có thể giảm ở mức 32 vì đường cong áp suất của quạt không tuyến tính. Kết quả là sự suy giảm hiệu suất không liên tục trông giống như vấn đề về chất lượng liên kết nhưng thực chất là vấn đề về khả năng làm mát.

 

Quyết định 800G của bạn có ý nghĩa gì đối với 1,6T

 

Thị trường mô-đun quang 800G sẽ tăng gần gấp ba vào cuối thập kỷ này, với LPO và quang học đồng đóng gói-dự kiến ​​sẽ chiếm hơn 30% tổng số lượt cài đặt cổng 800G-trở lên{5}}vào năm 2028 ([Đếm ánh sáng qua Tóm tắt]). Quyết định về yếu tố hình thức của bạn hôm nay phù hợp hoặc đi ngược lại quỹ đạo đó.

 

OSFP có đường dẫn nâng cấp được xác định thông qua các mô-đun OSFP{0}}XD và OSFP224 phù hợp với cùng một cơ sở hạ tầng lồng với những thay đổi cơ học gia tăng. QSFP-DD phân nhánh thành QSFP112, đưa ra các câu hỏi về khả năng tương thích của riêng nó. Nếu tổ chức của bạn đang lên kế hoạch triển khai 1.6T trong vòng 36 tháng và xây dựng cơ sở hạ tầng chuyển mạch mới, OSFP sẽ cung cấp cho bạn lộ trình di chuyển trực tiếp nhất. Nếu bạn đang vận hành nhóm QSFP-DD hiện có và 1.6T là cuộc trò chuyện từ năm 2028 trở lên, thì QSFP-DD800 sẽ tránh được quá trình chuyển đổi hệ số dạng giữa-chu kỳ vốn gây tốn kém trên quy mô lớn.

 

FB-LINK cung cấp cả mô-đun OSFP và QSFP{1}}DD800 trên toàn bộ danh mục 800G: các biến thể SR8, DR8, 2×DR4, 2×FR4 và 2×LR4. Các mô-đun của chúng tôi đã được xác thực nền tảng, được mã hóa theo yêu cầu cho bộ chuyển mạch và NIC cụ thể của bạn, đồng thời gửi kèm các báo cáo thử nghiệm dựa trên cấu hình phần cứng của bạn. Nếu bạn cần xác minh khả năng tương thích của hệ số dạng, độ vừa khít hoặc hỗ trợ LPO trước khi thực hiện đơn đặt hàng số lượng lớn, [đội ngũ kỹ thuật của chúng tôi thực hiện việc xác thực đó miễn phí].

 


 

Được viết bởi nhóm bán hàng kỹ thuật và kỹ thuật quang học của FB-LINK, dựa trên hỗ trợ triển khai trên các dự án kết nối doanh nghiệp, siêu quy mô và HPC kể từ năm 2012.

Gửi yêu cầu