英伟达开放AI模型,推动开发者生态
英伟达在本周一宣布了一项重大决定:收购开源调度软件公司SchedMD,并同时发布了名为Nemotron3的新一代大语言模型系列。这一举动不仅标志着英伟达对开源技术的开放态度,也反映了其战略重点从闭源转向开源的决心。 Nemotron3系列包括Nano、Super和Ultra三种规格的大规模预训练模型。通过混合专家(MoE)架构,Nemotron3在吞吐量和上下文窗口扩展能力方面取得了显著提升。其中,Nano型号的性能是前代产品的四倍,其token生成能力和上下文窗口容量也分别增加了60%和七倍。 英伟达还公开了模型权重、合成预训练语料以及详细的训练配方,并采用了NVIDIA OpenModelLicense许可协议,允许开发者进行商业应用、衍生模型创建与分发。此外,英伟达提供了配套的开发工具库如NeMo Gym和NeMo RL等,以支持强化学习训练及安全评估。 此次合作不仅展示了英伟达在开源领域的领先地位,也预示着未来更多AI生态系统的开放性将逐渐增强。通过收购SchedMD公司并将其整合到自身产品中,英伟达进一步巩固了其在HPC和人工智能集群调度系统中的市场地位。