OpenAI：为了评估语言模型的事实性，推出了名为SIMPLEQA的新基准，并将其开源。-虎嗅网

1031

AI新技能

机器人们又get了什么新本领？

OpenAI：为了评估语言模型的事实性，推出了名为SIMPLEQA的新基准，并将其开源。

当地时间10月30日，美国开放人工智能研究中心（OpenAI）宣布，为了衡量语言模型的真实性，将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。

2024-10-31