浪潮信息元脑R1推理服务器成功适配SGLang框架,大幅提升并发访问能力

浪潮信息元脑R1推理服务器现已完成对开源框架SGLang最新版本的深度适配,显著提升了其在高性能运行DeepSeek R1 671B模型时的表现。该服务器能够支持超过1000路用户并发访问,展现出卓越的处理能力。搭载FP8计算引擎的NF5688G7服务器,在部署DeepSeek R1 671B模型时不仅速度快且无精度损失,显存带宽高达4.8TB/s,确保了推理解码阶段的极致加速。此外,GPU P2P带宽达900GB/s,进一步保障了最佳通讯性能,完美契合模型的技术特征。这一进展标志着浪潮信息在高性能计算领域的又一重要突破。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1