这两年AI训练集群的规模越做越大,一个集群里几千张GPU已经很常见,这些GPU之间需要频繁交换数据,通信带宽就成了决定训练效率的瓶颈。单卡算力再高,如果数据传不过来,算力也只能等着。400G光模块在早期还能应付,但当模型参数从千亿级往万亿级走的时候,400G的单端口带宽确实不够用了。800G光模块把单链路带宽翻了一倍,在同样端口密度下能提供更高的总吞吐量,这对大规模集群来说是个很实在的提升。

从工程角度看,800G光模块并不是简单地把两个400G拼在一起,它的光学设计、信号处理、散热结构和功耗控制都要重新做。奥远光通在做产品定义的时候,重点盯了两件事:一是功耗,二是兼容性。硅光方案的800G光模块功耗控制在12W以内,在高密度部署或者液冷环境里优势比较明显。同时模块跟华为、思科、英伟达这些主流交换设备都做了兼容性验证,用户在数据中心里混用不同品牌的设备时,运维和管理不会出问题。
800G光模块用的光芯片、电芯片和无源器件,现在已经进入了稳定量产阶段,成本和交付周期都有了保障。奥远光通选择在这个时间点集中做800G产品,是因为时机刚好——太早了方案不成熟、成本太高,太晚了又会错过智算中心从400G向800G升级的窗口期。
在应用上,800G光模块主要用在AI训练集群和超大规模数据中心互联,这类场景对可靠性的要求比普通数据中心高很多,一个模块出问题可能影响整个训练任务。奥远光通在产品里加入了故障隔离、链路监控和动态功耗调节这些功能,确保模块在长期高负载运行下能稳定工作。
技术路线上,奥远光通在800G产品上同时做了硅光方案和传统方案,硅光在集成度和一致性上有长期优势,适合大规模部署;传统方案在某些特定传输距离和应用场景里性能更稳。两条路并行,既能满足当前市场对成熟方案的需求,也为下一代1.6T产品积累工艺经验。
奥远光通选择从800G切入,是因为这个速率节点正好处在规模化部署的起点,技术方案趋于稳定,用户需求明确,供应链也能跟上。在这个节点上把产品能力和交付体系建起来,既能服务当前智算中心的建设需求,也为后续向更高速率演进打下基础。800G光模块是目前智算网络中技术成熟度和应用价值都比较均衡的一个速率节点,奥远光通的产品布局也一直围绕这个判断在推进。













