Mellanox NVIDIA MQM9700-NS2R IB交换机-NVIDIA IB 交换机-北京中科新远科技有限公司

Products

产品中心

首页产品中心 NVIDIA NVIDIA IB 交换机

Mellanox NVIDIA MQM9700-NS2R IB交换机

热特热热特瑞特任

NVIDIA Quantum‑2 QM9700 系列是基于 NDR 400Gb/s 技术的 InfiniBand 固定配置交换机，在 1U 机箱内提供 64 个 400Gb/s 端口，聚合双向吞吐量高达 51.2Tb/s，包处理能力超过 66.5Bpps。该系列集成了第三代 SHARP (SHARPv3) 网络计算引擎，支持在网计算加速，可将 AI 应用的聚合性能提升 32 倍。QM9700 与 QM9790 分别面向需要内部子网管理器和外部 Unified Fabric Manager (UFM) 管理的场景，适用于超大规模 HPC、AI 数据中心以及企业核心架构。

在线咨询

产品详情

Application AI Training / HPC / Hyperscale Analytics

Model Number MQM9700/9790 Series

Management Type Managed (Internal SM) & Unmanaged (UFM)

Port Configuration 64 ports 400Gb/s (32 OSFP) / 128 ports 200Gb/s

Airflow Direction Forward (P2C) / Reverse (C2P) options

Highlight 51.2Tb/s, 66.5Bpps, SHARPv3, 1U

Product Description

NVIDIA Quantum‑2 QM9700 系列 400Gb/s InfiniBand 智能交换机，以 51.2Tb/s 聚合吞吐量和第三代 SHARP 网络计算引擎，为 AI 与 HPC 提供业界领先的性能与密度。

Product Overview

Key Characteristics

超高吞吐与端口密度 — 64 个 400Gb/s 端口（32 个 OSFP 连接器），非阻塞架构下总吞吐量达 51.2Tb/s，满足最严苛的并行计算需求。
SHARPv3 网络计算 — 第三代 NVIDIA 可扩展分层聚合归约协议，将 AI 加速能力较上一代提高 32 倍，减少数据移动，提升应用运行时效率。
灵活端口拆分 (Port Split) — 支持将每个 400Gb/s 端口拆分为两个 200Gb/s 端口，实现 128 个 200Gb/s 接口，优化胖树等拓扑的成本与密度。
智能运维与自愈 — 内置自适应路由、拥塞控制、增强虚拟通道 (VL) 及 QoS，结合自我修复网络能力，保证高应用吞吐和可靠性。
双重管理模式 — QM9700 集成板载子网管理器 (支持 ≤2000 节点)；QM9790 可搭配 NVIDIA UFM 平台实现全网主动式监控与运维。
广泛拓扑兼容 — 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等架构，并向后兼容上一代 InfiniBand 设备。

Core Technologies

NDR 400Gb/s — 400G per port, doubling the data rate of HDR, enabling the highest fabric bandwidth.
SHARPv3 — In‑network computing engine that performs data reduction and aggregation, offloading MPI operations from CPUs.
RDMA (Remote Direct Memory Access) — Zero‑copy, low‑latency data transfer without kernel involvement.
Adaptive Routing — Dynamically balances traffic to avoid congestion and optimize link utilization.
Port Split Technology — Converts one 400G OSFP port into two independent 200G ports, doubling radix for 200G designs.
Self‑Healing Network — Automatic path failover and link recovery to maintain fabric availability.

Operational Principle

QM9700 系列交换机在 InfiniBand 结构中作为核心交换节点，采用硬件加速的包转发引擎。每个数据包通过无阻塞的交叉矩阵在端口间转发，结合自适应路由算法动态选择最优路径，避免拥塞点。RDMA 技术允许端点直接访问远程内存，大幅降低延迟。SHARPv3 将归约/聚合操作卸载到交换机上，在数据流经网络时完成部分计算，从而减少集群整体通信量并加速分布式训练和模拟应用。板载子网管理器 (QM9700) 或外部 UFM (QM9790) 负责整个网络的配置、监控和故障恢复。

Application Scenarios

AI 深度学习训练 — 为大规模 GPU 集群提供极低延迟、高吞吐的通信，加速模型迭代。
高性能计算 (HPC) — 支撑气候模拟、基因测序、计算化学等需实时交换海量数据的科学工作负载。
超大规模数据分析 — 满足实时大数据分析、推荐引擎等应用对高并发低延迟网络的需求。
企业融合云/存储 — 通过 RDMA 和 QoS 为分布式存储和虚拟化环境提供稳定、可预测的性能。

Specifications & Model Selection

Performance	400Gb/s per port, 64 non‑blocking ports, aggregate 51.2Tb/s
Switch Radix	64 ports 400Gb/s (or 128 ports 200Gb/s with port split)
Connectors & Cabling	32 OSFP connectors; passive/active copper or active fiber cables
Management	1x USB 3.0, 1x USB (I2C), 1x RJ45, 1x RJ45 (UART); MLNX‑OS
CPU / Memory / Storage	x86 Coffee Lake i3; 8GB DDR4 SO‑DIMM (2666 MT/s); 16GB M.2 SATA SSD
Power Supply	1+1 redundant & hot‑swappable, 200‑240Vac, 80+ Gold, ENERGY STAR
Cooling	Front‑to‑rear or rear‑to‑front, hot‑swappable fan units
Dimensions (HxWxD)	1.7 in (43.6 mm) x 17.0 in (438 mm) x 26.0 in (660.4 mm)
Weight	14.5 kg (32.0 lbs)
Operating Temperature	0°C to 40°C
Non‑operating Temperature	-40°C to 70°C
Humidity (operating)	10% to 85% non‑condensing
Altitude	Up to 3050 m (10,000 ft)
EMC (Emissions)	CE, FCC, VCCI, ICES, RCM
Safety Compliance	RoHS, CB, cTUVus, CE, CU
Warranty	1 year

Series Comparison

Orderable Part Number (OPN)	Description	Key Differentiator
MQM9700-NS2F	64‑port 400Gb/s, 32 OSFP, managed, power‑to‑connector (P2C) forward airflow	内置子网管理器 (≤2000 nodes), 前向风道
MQM9700-NS2R	64‑port 400Gb/s, 32 OSFP, managed, connector‑to‑power (C2P) reverse airflow	内置子网管理器, 后向风道
MQM9790-NS2F	64‑port 400Gb/s, 32 OSFP, unmanaged, P2C forward airflow	无内部 SM, 需配合 UFM 管理, 前向风道
MQM9790-NS2R	64‑port 400Gb/s, 32 OSFP, unmanaged, C2P reverse airflow	无内部 SM, 需配合 UFM 管理, 后向风道

Competitive Advantages

密度与能耗领先 — 1U 空间提供 64 个 400G 端口，较同类产品降低功耗和机架占用。
网络计算加速 — 独有 SHARPv3 技术，将 AI/HPC 应用关键通信模式卸载至网络，大幅提升有效算力。
运维灵活性 — 同时提供板载子网管理器与 UFM 两种方案，适应不同规模与管理习惯。
拓扑自由度 — 支持多种高级拓扑 (Fat Tree, DragonFly+, Torus) 及端口拆分，优化网络总拥有成本。
完全向后兼容 — 无缝接入现有 InfiniBand 环境，保护用户投资。

Service & Support

标准保修 — 1 年硬件有限保修 (依据 PDF 明确标注)。
软件支持 — 预装 MLNX‑OS，可选 NVIDIA UFM 平台 (针对 QM9790) 进行集中管理。
认证合规 — 产品通过 CE, FCC, VCCI, ICES, RCM, RoHS, CB, cTUVus, CU 等安全与环保认证。
文档与工具 — 提供 CLI、WebUI、SNMP、JSON 接口，简化配置与监控。

Frequently Asked Questions

Q: QM9700 与 QM9790 的核心区别是什么？

A: QM9700 集成板载子网管理器，可独立管理最多 2000 节点；QM9790 为无内置 SM 版本，需配合 NVIDIA UFM 进行外部管理，适合超大规模或需要高级监控的环境。

Q: 如何实现 128 个 200Gb/s 端口？

A: 通过 NVIDIA 端口拆分技术，每个 OSFP 物理端口可配置为 2 个独立的 200Gb/s 逻辑端口，从而使 32 个 OSFP 接口提供 128 个 200G 端口。

Q: 交换机支持哪些网络拓扑？

A: 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等多种拓扑，适应不同规模和冗余要求的场景。

Q: 该系列能否兼容上一代 InfiniBand 设备？

A: 是的，QM9700 系列完全向后兼容 HDR、EDR 等上一代 InfiniBand 技术，可平滑升级现有集群。

Important Precautions

环境温度 — 运行温度 0°C 至 40°C，非运行温度 -40°C 至 70°C。
湿度 — 运行湿度 10%~85% (非冷凝)，非运行湿度 10%~90% (非冷凝)。
海拔 — 最高工作海拔 3050 米。
电源要求 — 输入范围 200‑240Vac，采用 1+1 冗余热插拔电源，80+ Gold 认证。
通风与气流 — 确认机架通风方向与所选型号 (P2C 或 C2P) 一致，保持风扇模块正常工作。
合规维护 — 设备应符合当地 EMC 及安全规范 (CE, FCC 等)，并由专业人员维护。