- 超高吞吐与端口密度 — 64 个 400Gb/s 端口(32 个 OSFP 连接器),非阻塞架构下总吞吐量达 51.2Tb/s,满足最严苛的并行计算需求。
- SHARPv3 网络计算 — 第三代 NVIDIA 可扩展分层聚合归约协议,将 AI 加速能力较上一代提高 32 倍,减少数据移动,提升应用运行时效率。
- 灵活端口拆分 (Port Split) — 支持将每个 400Gb/s 端口拆分为两个 200Gb/s 端口,实现 128 个 200Gb/s 接口,优化胖树等拓扑的成本与密度。
- 智能运维与自愈 — 内置自适应路由、拥塞控制、增强虚拟通道 (VL) 及 QoS,结合自我修复网络能力,保证高应用吞吐和可靠性。
- 双重管理模式 — QM9700 集成板载子网管理器 (支持 ≤2000 节点);QM9790 可搭配 NVIDIA UFM 平台实现全网主动式监控与运维。
- 广泛拓扑兼容 — 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等架构,并向后兼容上一代 InfiniBand 设备。
- NDR 400Gb/s — 400G per port, doubling the data rate of HDR, enabling the highest fabric bandwidth.
- SHARPv3 — In‑network computing engine that performs data reduction and aggregation, offloading MPI operations from CPUs.
- RDMA (Remote Direct Memory Access) — Zero‑copy, low‑latency data transfer without kernel involvement.
- Adaptive Routing — Dynamically balances traffic to avoid congestion and optimize link utilization.
- Port Split Technology — Converts one 400G OSFP port into two independent 200G ports, doubling radix for 200G designs.
- Self‑Healing Network — Automatic path failover and link recovery to maintain fabric availability.
- AI 深度学习训练 — 为大规模 GPU 集群提供极低延迟、高吞吐的通信,加速模型迭代。
- 高性能计算 (HPC) — 支撑气候模拟、基因测序、计算化学等需实时交换海量数据的科学工作负载。
- 超大规模数据分析 — 满足实时大数据分析、推荐引擎等应用对高并发低延迟网络的需求。
- 企业融合云/存储 — 通过 RDMA 和 QoS 为分布式存储和虚拟化环境提供稳定、可预测的性能。
| Performance | 400Gb/s per port, 64 non‑blocking ports, aggregate 51.2Tb/s |
| Switch Radix | 64 ports 400Gb/s (or 128 ports 200Gb/s with port split) |
| Connectors & Cabling | 32 OSFP connectors; passive/active copper or active fiber cables |
| Management | 1x USB 3.0, 1x USB (I2C), 1x RJ45, 1x RJ45 (UART); MLNX‑OS |
| CPU / Memory / Storage | x86 Coffee Lake i3; 8GB DDR4 SO‑DIMM (2666 MT/s); 16GB M.2 SATA SSD |
| Power Supply | 1+1 redundant & hot‑swappable, 200‑240Vac, 80+ Gold, ENERGY STAR |
| Cooling | Front‑to‑rear or rear‑to‑front, hot‑swappable fan units |
| Dimensions (HxWxD) | 1.7 in (43.6 mm) x 17.0 in (438 mm) x 26.0 in (660.4 mm) |
| Weight | 14.5 kg (32.0 lbs) |
| Operating Temperature | 0°C to 40°C |
| Non‑operating Temperature | -40°C to 70°C |
| Humidity (operating) | 10% to 85% non‑condensing |
| Altitude | Up to 3050 m (10,000 ft) |
| EMC (Emissions) | CE, FCC, VCCI, ICES, RCM |
| Safety Compliance | RoHS, CB, cTUVus, CE, CU |
| Warranty | 1 year |
| Orderable Part Number (OPN) | Description | Key Differentiator |
|---|---|---|
| MQM9700-NS2F | 64‑port 400Gb/s, 32 OSFP, managed, power‑to‑connector (P2C) forward airflow | 内置子网管理器 (≤2000 nodes), 前向风道 |
| MQM9700-NS2R | 64‑port 400Gb/s, 32 OSFP, managed, connector‑to‑power (C2P) reverse airflow | 内置子网管理器, 后向风道 |
| MQM9790-NS2F | 64‑port 400Gb/s, 32 OSFP, unmanaged, P2C forward airflow | 无内部 SM, 需配合 UFM 管理, 前向风道 |
| MQM9790-NS2R | 64‑port 400Gb/s, 32 OSFP, unmanaged, C2P reverse airflow | 无内部 SM, 需配合 UFM 管理, 后向风道 |
- 密度与能耗领先 — 1U 空间提供 64 个 400G 端口,较同类产品降低功耗和机架占用。
- 网络计算加速 — 独有 SHARPv3 技术,将 AI/HPC 应用关键通信模式卸载至网络,大幅提升有效算力。
- 运维灵活性 — 同时提供板载子网管理器与 UFM 两种方案,适应不同规模与管理习惯。
- 拓扑自由度 — 支持多种高级拓扑 (Fat Tree, DragonFly+, Torus) 及端口拆分,优化网络总拥有成本。
- 完全向后兼容 — 无缝接入现有 InfiniBand 环境,保护用户投资。
- 标准保修 — 1 年硬件有限保修 (依据 PDF 明确标注)。
- 软件支持 — 预装 MLNX‑OS,可选 NVIDIA UFM 平台 (针对 QM9790) 进行集中管理。
- 认证合规 — 产品通过 CE, FCC, VCCI, ICES, RCM, RoHS, CB, cTUVus, CU 等安全与环保认证。
- 文档与工具 — 提供 CLI、WebUI、SNMP、JSON 接口,简化配置与监控。
Q: QM9700 与 QM9790 的核心区别是什么?
A: QM9700 集成板载子网管理器,可独立管理最多 2000 节点;QM9790 为无内置 SM 版本,需配合 NVIDIA UFM 进行外部管理,适合超大规模或需要高级监控的环境。
Q: 如何实现 128 个 200Gb/s 端口?
A: 通过 NVIDIA 端口拆分技术,每个 OSFP 物理端口可配置为 2 个独立的 200Gb/s 逻辑端口,从而使 32 个 OSFP 接口提供 128 个 200G 端口。
Q: 交换机支持哪些网络拓扑?
A: 支持 Fat Tree、SlimFly、DragonFly+、多维 Torus 等多种拓扑,适应不同规模和冗余要求的场景。
Q: 该系列能否兼容上一代 InfiniBand 设备?
A: 是的,QM9700 系列完全向后兼容 HDR、EDR 等上一代 InfiniBand 技术,可平滑升级现有集群。
- 环境温度 — 运行温度 0°C 至 40°C,非运行温度 -40°C 至 70°C。
- 湿度 — 运行湿度 10%~85% (非冷凝),非运行湿度 10%~90% (非冷凝)。
- 海拔 — 最高工作海拔 3050 米。
- 电源要求 — 输入范围 200‑240Vac,采用 1+1 冗余热插拔电源,80+ Gold 认证。
- 通风与气流 — 确认机架通风方向与所选型号 (P2C 或 C2P) 一致,保持风扇模块正常工作。
- 合规维护 — 设备应符合当地 EMC 及安全规范 (CE, FCC 等),并由专业人员维护。