产品中心
Detail Information Product Description
Application高性能计算、人工智能、超大规模分析、云数据中心
Condition[Manual Fill]
Model NumberQM9700 / QM9790 系列
Port Configuration64端口 400Gb/s (32个OSFP连接器)
Management TypeQM9700: 内置管理 / QM9790: 外部管理(UFM)
Airflow DirectionP2C (前至连接器) 或 C2P (连接器至电源) 可选
Highlight51.2Tb/s吞吐量, 66.5Bpps, SHARPv3, 1U 64端口400G
Warranty1年

NVIDIA Quantum-2 QM9700 系列:1U 空间提供 64 个 400Gb/s InfiniBand 端口,聚合吞吐量 51.2Tb/s,集成 SHARPv3 网络计算引擎,为超大规模 HPC 和 AI 数据中心打造。

产品概述

NVIDIA Quantum-2 QM9700 系列是基于 NDR 400Gb/s InfiniBand 技术的智能交换机,采用 1U 标准机箱设计,提供 64 个无阻塞 400G 端口,双向聚合吞吐量高达 51.2Tb/s,报文转发能力超过 665 亿包/秒。该系列支持第三代 SHARP (SHARPv3) 网络内计算,可加速 AI 训练中的集合通信,相比上一代性能提升 32 倍。QM9700 集成 RDMA、自适应路由、服务质量控制和增强虚拟通道映射,实现自愈网络与极低延迟。兼容 Fat Tree、DragonFly+、多维 Torus 等多种拓扑,并向后兼容上一代 InfiniBand 设备,为科研、AI 开发及企业数据中心提供卓越的网络性能与可扩展性。

主要特性

  • 超高密度与吞吐量:1U 机箱集成 64 个 400Gb/s 端口,聚合带宽 51.2Tb/s,包处理能力 66.5Bpps,满足最严苛的扩展需求。
  • SHARPv3 网络内计算:第三代可扩展分层聚合协议,将归约操作卸载至交换机,AI 集体通信加速 32 倍,降低数据搬运开销。
  • 自适应路由与 RDMA:动态路径选择避免拥塞,结合远程直接内存访问,提升应用吞吐并实现网络自愈。
  • 端口拆分灵活性:支持将 400Gb/s 端口拆分为两个 200Gb/s 端口,最大可提供 128 个 200G 端口,优化两层 Fat Tree 等拓扑成本。
  • 双重管理选项:QM9700 内置子网管理器,开箱即用支持多达 2000 节点;QM9790 可配合 NVIDIA UFM 实现集中监控与主动运维。
  • 广泛拓扑兼容:支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等多种架构,适应不同规模数据中心设计。

核心技术

  • NDR 400Gb/s:第四代 NVIDIA InfiniBand 技术,单端口速率 400G,提供业界领先的带宽与端口密度。
  • SHARPv3:在数据流经网络时执行归约操作,显著减少节点间通信量,加速分布式训练与科学计算。
  • RDMA 与自适应路由:允许节点直接访问远程内存,同时动态选择最优路径,避免热点和链路故障。
  • 端口拆分技术:将 400G 端口灵活配置为 2×200G,为不同速度需求提供经济高效的拓扑方案。
  • QoS 与拥塞控制:增强虚拟通道映射和拥塞管理机制,保障关键流量性能,提升整体应用吞吐。

工作原理

QM9700 作为 InfiniBand 结构中的核心交换设备,采用基于信用的流控机制确保无丢包传输。自适应路由引擎实时监控链路状态,动态调整数据包路径以绕过拥塞区域。SHARPv3 将集合通信操作卸载到交换机内部的算术逻辑单元,在数据包转发过程中完成规约计算,大幅减少节点间的通信往返。内置子网管理器 (QM9700) 负责结构初始化、路由计算和故障恢复;QM9790 则通过 NVIDIA UFM 实现集中式结构管理、性能监控与预防性维护。QoS 与虚拟通道共同保障多租户环境下的带宽隔离与确定性延迟。

应用场景

  • AI 训练与深度学习:为大规模分布式训练提供高带宽、低延迟通信,SHARPv3 加速梯度聚合。
  • 高性能计算 (HPC):气候模拟、计算流体力学、量子化学等需要极高消息率的应用。
  • 超大规模数据分析:内存数据库、实时分析利用 RDMA 和网络内计算提升查询性能。
  • 云与企业数据中心:虚拟化环境、多租户业务对高密度、低延迟和可管理性的综合需求。

规格与选型

端口配置 64 个 400Gb/s InfiniBand 端口 (32 个 OSFP 连接器);支持端口拆分为 128 个 200Gb/s 端口
聚合吞吐量 51.2 Tb/s (双向)
包处理能力 >665 亿包/秒 (BPPS)
交换基数 64 个 400Gb/s 非阻塞端口
管理方式 QM9700:内置子网管理器 (MLNX-OS);QM9790:外部 NVIDIA UFM 管理
CPU/内存/存储 x86 Coffee Lake i3;8GB DDR4 SO-DIMM (2666 MT/s);16GB M.2 SATA SSD
电源 1+1 冗余热插拔,输入 200-240Vac,80 Gold+ 及 ENERGY STAR 认证
散热 前至后 (P2C) 或后至前 (C2P) 风道,热插拔风扇单元
尺寸 (高×宽×深) 1.7 英寸 (43.6 mm) x 17.0 英寸 (438 mm) x 26.0 英寸 (660.4 mm)
重量 14.5 kg
工作温度 0°C 至 40°C
湿度 / 海拔 工作 10%~85% 无冷凝;非工作 10%~90% 无冷凝;海拔 ≤3050m
EMC/安全认证 CE, FCC, VCCI, ICES, RCM;RoHS, CB, cTUVus, CE, CU

系列对比

Orderable Part Number (OPN) 描述 关键差异
MQM9700-NS2F 64端口 400Gb/s, 32 OSFP, 带内管理, P2C 风道 (向前) 内置子网管理器,支持 2000 节点,适合独立部署
MQM9700-NS2R 64端口 400Gb/s, 32 OSFP, 带内管理, C2P 风道 (反向) 反向风道设计,适应不同机柜散热布局
MQM9790-NS2F 64端口 400Gb/s, 32 OSFP, 外部管理, P2C 风道 (向前) 无内置子网管理器,需配合 NVIDIA UFM 实现集中管控
MQM9790-NS2R 64端口 400Gb/s, 32 OSFP, 外部管理, C2P 风道 (反向) 外部管理 + 反向风道,适用于 UFM 托管的大型环境

竞争优势

  • 无与伦比的 1U 密度:64 端口 400G 使网络设计更扁平,降低布线复杂度及功耗。
  • SHARPv3 加速:AI 集体通信性能提升 32 倍,大幅缩短训练时间。
  • 拓扑灵活性:支持 Fat Tree、DragonFly+、Torus 等多种拓扑,自适应路由优化任意结构。
  • 完全向后兼容:可无缝集成上一代 InfiniBand 设备,保护现有投资。
  • 管理多样性:从独立子网管理器到 UFM 集中控制,满足不同规模数据中心运维需求。
  • 高可靠设计:冗余电源、热插拔风扇、自愈网络,确保关键业务持续运行。

服务与支持

  • 保修:1 年标准保修,可通过渠道扩展。
  • 软件与管理:QM9700 预装 MLNX-OS,支持 CLI、WebUI、SNMP、JSON 接口;QM9790 支持 NVIDIA UFM 高级功能。
  • 合规认证:产品通过 RoHS、CB、cTUVus、CE、CU 安全认证,EMC 符合 CE、FCC、VCCI、ICES、RCM。
  • 热插拔部件:电源和风扇模块均支持不中断业务更换。
  • 技术支持:提供文档、参考设计及全球合作伙伴支持网络。

常见问题

  • 问:QM9700 内置子网管理器最多支持多少节点?
    答:最多支持 2000 个节点,无需外部服务器即可完成结构初始化。
  • 问:能否将 400G 端口拆分为 200G 使用?
    答:可以。通过 NVIDIA 端口拆分技术,每个 OSFP 端口可配置为 2x200Gb/s,整机可提供 128 个 200G 端口。
  • 问:QM9790 是否完全不可管理?
    答:QM9790 无内置子网管理器,但可被 NVIDIA UFM 全面管理,实现集中监控、主动运维和结构优化。
  • 问:支持哪些线缆类型?
    答:支持无源/有源铜缆、有源光缆以及光模块 (OSFP 封装)。

重要注意事项

  • 运行环境:工作温度 0°C 至 40°C,工作湿度 10%~85% 无冷凝,海拔不超过 3050m。
  • 电源要求:输入电压范围 200-240Vac,必须使用匹配的电源模块,确保冗余供电。
  • 风道选择:根据机房散热方向选择 P2C (前向后排) 或 C2P (后向前排) 型号,不可混用。
  • EMC 与安全:设备应安装在限制访问区域,遵守当地电磁兼容和安全规范。
  • 维护:仅允许经培训人员更换热插拔部件,操作时需确保接地良好。

Copyright © 2011-2026 北京中科新远科技有限公司 版权所有  Sitemap 备案号: