简体中文
关闭
产品中心
产品详情
Application AI Training / HPC / Hyperscale Analytics
Model Number MQM9700/9790 Series
Management Type Managed (Internal SM) & Unmanaged (UFM)
Port Configuration 64 ports 400Gb/s (32 OSFP) / 128 ports 200Gb/s
Airflow Direction Forward (P2C) / Reverse (C2P) options
Highlight 51.2Tb/s, 66.5Bpps, SHARPv3, 1U
 
 
Product Description
NVIDIA Quantum‑2 QM9700 系列 400Gb/s InfiniBand 智能交换机,以 51.2Tb/s 聚合吞吐量和第三代 SHARP 网络计算引擎,为 AI 与 HPC 提供业界领先的性能与密度。
Product Overview
NVIDIA Quantum‑2 QM9700 系列是基于 NDR 400Gb/s 技术的 InfiniBand 固定配置交换机,在 1U 机箱内提供 64 个 400Gb/s 端口,聚合双向吞吐量高达 51.2Tb/s,包处理能力超过 66.5Bpps。该系列集成了第三代 SHARP (SHARPv3) 网络计算引擎,支持在网计算加速,可将 AI 应用的聚合性能提升 32 倍。QM9700 与 QM9790 分别面向需要内部子网管理器和外部 Unified Fabric Manager (UFM) 管理的场景,适用于超大规模 HPC、AI 数据中心以及企业核心架构。
Key Characteristics
  • 超高吞吐与端口密度 — 64 个 400Gb/s 端口(32 个 OSFP 连接器),非阻塞架构下总吞吐量达 51.2Tb/s,满足最严苛的并行计算需求。
  • SHARPv3 网络计算 — 第三代 NVIDIA 可扩展分层聚合归约协议,将 AI 加速能力较上一代提高 32 倍,减少数据移动,提升应用运行时效率。
  • 灵活端口拆分 (Port Split) — 支持将每个 400Gb/s 端口拆分为两个 200Gb/s 端口,实现 128 个 200Gb/s 接口,优化胖树等拓扑的成本与密度。
  • 智能运维与自愈 — 内置自适应路由、拥塞控制、增强虚拟通道 (VL) 及 QoS,结合自我修复网络能力,保证高应用吞吐和可靠性。
  • 双重管理模式 — QM9700 集成板载子网管理器 (支持 ≤2000 节点);QM9790 可搭配 NVIDIA UFM 平台实现全网主动式监控与运维。
  • 广泛拓扑兼容 — 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等架构,并向后兼容上一代 InfiniBand 设备。
Core Technologies
  • NDR 400Gb/s — 400G per port, doubling the data rate of HDR, enabling the highest fabric bandwidth.
  • SHARPv3 — In‑network computing engine that performs data reduction and aggregation, offloading MPI operations from CPUs.
  • RDMA (Remote Direct Memory Access) — Zero‑copy, low‑latency data transfer without kernel involvement.
  • Adaptive Routing — Dynamically balances traffic to avoid congestion and optimize link utilization.
  • Port Split Technology — Converts one 400G OSFP port into two independent 200G ports, doubling radix for 200G designs.
  • Self‑Healing Network — Automatic path failover and link recovery to maintain fabric availability.
Operational Principle
QM9700 系列交换机在 InfiniBand 结构中作为核心交换节点,采用硬件加速的包转发引擎。每个数据包通过无阻塞的交叉矩阵在端口间转发,结合自适应路由算法动态选择最优路径,避免拥塞点。RDMA 技术允许端点直接访问远程内存,大幅降低延迟。SHARPv3 将归约/聚合操作卸载到交换机上,在数据流经网络时完成部分计算,从而减少集群整体通信量并加速分布式训练和模拟应用。板载子网管理器 (QM9700) 或外部 UFM (QM9790) 负责整个网络的配置、监控和故障恢复。
Application Scenarios
  • AI 深度学习训练 — 为大规模 GPU 集群提供极低延迟、高吞吐的通信,加速模型迭代。
  • 高性能计算 (HPC) — 支撑气候模拟、基因测序、计算化学等需实时交换海量数据的科学工作负载。
  • 超大规模数据分析 — 满足实时大数据分析、推荐引擎等应用对高并发低延迟网络的需求。
  • 企业融合云/存储 — 通过 RDMA 和 QoS 为分布式存储和虚拟化环境提供稳定、可预测的性能。
Specifications & Model Selection
Performance 400Gb/s per port, 64 non‑blocking ports, aggregate 51.2Tb/s
Switch Radix 64 ports 400Gb/s (or 128 ports 200Gb/s with port split)
Connectors & Cabling 32 OSFP connectors; passive/active copper or active fiber cables
Management 1x USB 3.0, 1x USB (I2C), 1x RJ45, 1x RJ45 (UART); MLNX‑OS
CPU / Memory / Storage x86 Coffee Lake i3; 8GB DDR4 SO‑DIMM (2666 MT/s); 16GB M.2 SATA SSD
Power Supply 1+1 redundant & hot‑swappable, 200‑240Vac, 80+ Gold, ENERGY STAR
Cooling Front‑to‑rear or rear‑to‑front, hot‑swappable fan units
Dimensions (HxWxD) 1.7 in (43.6 mm) x 17.0 in (438 mm) x 26.0 in (660.4 mm)
Weight 14.5 kg (32.0 lbs)
Operating Temperature 0°C to 40°C
Non‑operating Temperature -40°C to 70°C
Humidity (operating) 10% to 85% non‑condensing
Altitude Up to 3050 m (10,000 ft)
EMC (Emissions) CE, FCC, VCCI, ICES, RCM
Safety Compliance RoHS, CB, cTUVus, CE, CU
Warranty 1 year
Series Comparison
Orderable Part Number (OPN) Description Key Differentiator
MQM9700-NS2F 64‑port 400Gb/s, 32 OSFP, managed, power‑to‑connector (P2C) forward airflow 内置子网管理器 (≤2000 nodes), 前向风道
MQM9700-NS2R 64‑port 400Gb/s, 32 OSFP, managed, connector‑to‑power (C2P) reverse airflow 内置子网管理器, 后向风道
MQM9790-NS2F 64‑port 400Gb/s, 32 OSFP, unmanaged, P2C forward airflow 无内部 SM, 需配合 UFM 管理, 前向风道
MQM9790-NS2R 64‑port 400Gb/s, 32 OSFP, unmanaged, C2P reverse airflow 无内部 SM, 需配合 UFM 管理, 后向风道
Competitive Advantages
  • 密度与能耗领先 — 1U 空间提供 64 个 400G 端口,较同类产品降低功耗和机架占用。
  • 网络计算加速 — 独有 SHARPv3 技术,将 AI/HPC 应用关键通信模式卸载至网络,大幅提升有效算力。
  • 运维灵活性 — 同时提供板载子网管理器与 UFM 两种方案,适应不同规模与管理习惯。
  • 拓扑自由度 — 支持多种高级拓扑 (Fat Tree, DragonFly+, Torus) 及端口拆分,优化网络总拥有成本。
  • 完全向后兼容 — 无缝接入现有 InfiniBand 环境,保护用户投资。
Service & Support
  • 标准保修 — 1 年硬件有限保修 (依据 PDF 明确标注)。
  • 软件支持 — 预装 MLNX‑OS,可选 NVIDIA UFM 平台 (针对 QM9790) 进行集中管理。
  • 认证合规 — 产品通过 CE, FCC, VCCI, ICES, RCM, RoHS, CB, cTUVus, CU 等安全与环保认证。
  • 文档与工具 — 提供 CLI、WebUI、SNMP、JSON 接口,简化配置与监控。
Frequently Asked Questions

Q: QM9700 与 QM9790 的核心区别是什么?

A: QM9700 集成板载子网管理器,可独立管理最多 2000 节点;QM9790 为无内置 SM 版本,需配合 NVIDIA UFM 进行外部管理,适合超大规模或需要高级监控的环境。

Q: 如何实现 128 个 200Gb/s 端口?

A: 通过 NVIDIA 端口拆分技术,每个 OSFP 物理端口可配置为 2 个独立的 200Gb/s 逻辑端口,从而使 32 个 OSFP 接口提供 128 个 200G 端口。

Q: 交换机支持哪些网络拓扑?

A: 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等多种拓扑,适应不同规模和冗余要求的场景。

Q: 该系列能否兼容上一代 InfiniBand 设备?

A: 是的,QM9700 系列完全向后兼容 HDR、EDR 等上一代 InfiniBand 技术,可平滑升级现有集群。

Important Precautions
  • 环境温度 — 运行温度 0°C 至 40°C,非运行温度 -40°C 至 70°C。
  • 湿度 — 运行湿度 10%~85% (非冷凝),非运行湿度 10%~90% (非冷凝)。
  • 海拔 — 最高工作海拔 3050 米。
  • 电源要求 — 输入范围 200‑240Vac,采用 1+1 冗余热插拔电源,80+ Gold 认证。
  • 通风与气流 — 确认机架通风方向与所选型号 (P2C 或 C2P) 一致,保持风扇模块正常工作。
  • 合规维护 — 设备应符合当地 EMC 及安全规范 (CE, FCC 等),并由专业人员维护。

Copyright © 2011-2024 北京中科新远科技有限公司 版权所有  Sitemap 备案号: