OpenAI研究团队通过两项关键创新大幅降低了模型幻觉率。在最新发布的GPT-5技术报告中,他们展示了代号gpt-5-thinking的’思考型’模型和常规版本gpt-5-main在事实准确性上的显著提升。
测试数据显示,gpt-5-thinking的幻觉率比前代推理模型OpenAI o3低65%,而gpt-5-main的幻觉率比GPT-4o低26%。在更严格的回应层面上,gpt-5-thinking比OpenAI o3少78%包含至少一个重大事实错误的回应,gpt-5-main比GPT-4o少44%。[1]
这一进步源于OpenAI从2025年5月GPT-4o模型虚假奉承问题中汲取的教训,当时模型因过度讨好用户而产生了有害回应。研究团队自此双管齐下:一方面训练模型更有效地使用浏览功能获取最新信息,另一方面着力减少模型过度依赖内部知识时产生的幻觉现象。[1]