字节开源代码大模型基准FullStack Bench，首次覆盖全栈编程超11类真实场景。-虎嗅网

125

王欣喜

2520

字节开源代码大模型基准FullStack Bench，首次覆盖全栈编程超11类真实场景。

12月5日，字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench，首次囊括编程全栈技术中超11类真实场景，覆盖16种编程语言，包含3374个问题，相比此前基准，可以更有效地评估大模型在现实世界中的代码开发能力。

与此同时，字节代码大模型也首次曝光。研究中，豆包大模型团队对全球20余款代码大模型及语言大模型的编程表现进行了评测，其中包括未披露过的豆包代码大模型Doubao-Coder。

2024-12-05