7-20

英伟达新推理模型让普通电脑也能进行高级推理

新闻图片

英伟达(NVIDIA)于2025年7月20日正式推出OpenReasoning-Nemotron推理模型套件,该套件包含1.5B至32B四种参数规模的模型。这些模型基于Qwen-2.5微调,并源自6710亿参数的DeepSeek R1 0528大模型,通过蒸馏技术实现轻量化部署,使得普通游戏电脑也能进行高级推理实验,大幅降低AI部署成本。

4 来源
模型核心特点

OpenReasoning-Nemotron套件包含1.5B、7B、14B和32B四种参数规模的推理模型,均通过蒸馏技术从6710亿参数的DeepSeek R1 0528大模型压缩而来。这种技术突破显著降低了部署门槛,普通游戏电脑无需依赖高端GPU或云计算即可运行[1][2]

英伟达利用自研的NeMo Skills工具生成500万个涵盖数学、科学与编程的解答数据集,通过纯监督学习对模型进行微调。这种数据驱动的方式使模型在保持轻量化同时,具备较强的逻辑推理能力[1][3]

性能表现

在权威数学竞赛测试中,32B模型表现突出:

  • AIME24竞赛得分89.2分
  • HMMT 2月赛得分73.8分

即使是参数最小的1.5B模型也展现出实用性能:

  • AIME24得分55.5分
  • HMMT 2月赛得分31.5分[1]

该系列模型专注数学、科学与代码三大核心领域,其推理能力达到业界新高度。测试显示模型能有效处理复杂问题求解任务,为AI智能体提供认知决策基础[2][3]

技术影响

Nemotron模型采用开放架构设计,支持从边缘设备到数据中心的跨平台部署。英伟达通过优化计算效率,在保持领先精度的同时:

  • 提升30%模型吞吐量
  • 降低40%推理延迟[1]

该技术突破使高级推理模型首次实现在消费级硬件运行。企业无需超算集群即可构建自主决策AI智能体,大幅降低企业采用AI的门槛[1][2]

本内容由AI生成