1031
OpenAI:为了评估语言模型的事实性,推出了名为SIMPLEQA的新基准,并将其开源。
当地时间10月30日,美国开放人工智能研究中心(OpenAI)宣布,为了衡量语言模型的真实性,将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。
2024-10-31
010
0/500虎嗅用户社区交流公约
OpenAI:为了评估语言模型的事实性,推出了名为SIMPLEQA的新基准,并将其开源。
当地时间10月30日,美国开放人工智能研究中心(OpenAI)宣布,为了衡量语言模型的真实性,将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。