1205
字节开源代码大模型基准FullStack Bench,首次覆盖全栈编程超11类真实场景。
12月5日,字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench,首次囊括编程全栈技术中超11类真实场景,覆盖16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。
与此同时,字节代码大模型也首次曝光。研究中,豆包大模型团队对全球20余款代码大模型及语言大模型的编程表现进行了评测,其中包括未披露过的豆包代码大模型Doubao-Coder。
2024-12-05
000
0/500虎嗅用户社区交流公约