NVIDIA 正式发布 Nemotron 3 Super,这是一款拥有 1200 亿参数、推理时仅激活 120 亿参数的开源大模型,专为大规模多智能体 AI 系统设计。该模型采用混合专家(MoE)架构,融合 Mamba 层与 Transformer 层,支持 100 万 token 上下文窗口,较上一代 Nemotron Super 模型吞吐量提升最高 5 倍、准确率提升最高 2 倍,并以开放权重形式在宽松许可协议下发布。
NVIDIA 发布 Nemotron 3 Super 开源模型
Previous: 微信上线通话“忽略”与语音翻译等功能