1013

《通用大模型评测标准》发布。

此次发布的评测标准基于“2-4-6”框架:“2”代表两类评测视角,以重点行业实际使用需求为导向,将评测任务划分为理解和生成两类视角;“4”代表四类评测要素,从评测全生命周期中提取出评测工具、评测数据、评测方式和评测指标四类关键要素;“6”代表六大评测维度,综合考虑大模型应用过程中的核心能力。

2024-10-13
011
0/500虎嗅用户社区交流公约