英伟达新推理模型让普通电脑也能进行高级推理

英伟达（NVIDIA）于2025年7月20日正式推出OpenReasoning-Nemotron推理模型套件，该套件包含1.5B至32B四种参数规模的模型。这些模型基于Qwen-2.5微调，并源自6710亿参数的DeepSeek R1 0528大模型，通过蒸馏技术实现轻量化部署，使得普通游戏电脑也能进行高级推理实验，大幅降低AI部署成本。

4 来源

模型核心特点

OpenReasoning-Nemotron套件包含1.5B、7B、14B和32B四种参数规模的推理模型，均通过蒸馏技术从6710亿参数的DeepSeek R1 0528大模型压缩而来。这种技术突破显著降低了部署门槛，普通游戏电脑无需依赖高端GPU或云计算即可运行[1][2]。

英伟达利用自研的NeMo Skills工具生成500万个涵盖数学、科学与编程的解答数据集，通过纯监督学习对模型进行微调。这种数据驱动的方式使模型在保持轻量化同时，具备较强的逻辑推理能力[1][3]。

3 来源

性能表现

在权威数学竞赛测试中，32B模型表现突出：

AIME24竞赛得分89.2分
HMMT 2月赛得分73.8分

即使是参数最小的1.5B模型也展现出实用性能：

AIME24得分55.5分
HMMT 2月赛得分31.5分[1]

该系列模型专注数学、科学与代码三大核心领域，其推理能力达到业界新高度。测试显示模型能有效处理复杂问题求解任务，为AI智能体提供认知决策基础[2][3]。

3 来源

技术影响

Nemotron模型采用开放架构设计，支持从边缘设备到数据中心的跨平台部署。英伟达通过优化计算效率，在保持领先精度的同时：

提升30%模型吞吐量
降低40%推理延迟[1]

该技术突破使高级推理模型首次实现在消费级硬件运行。企业无需超算集群即可构建自主决策AI智能体，大幅降低企业采用AI的门槛[1][2]。

2 来源

本内容由AI生成