GPT-4、ChatGPT、CODEGEN、VICUNA、SANTACODER、INCODER、GPT-J、GPT-NEO、PolyCoder、StableLM-α 。
【LLM代码准确率平均降低15%】从表格中来看,经过严格测试后,这群AI的生成准确率都有所下落:

文章插图
这里会通过一种名叫pass@k的方法评估准确率,其中k是允许大模型给问题生成的程序数量,n是用于测试的输入数量,c是正确的输入数量:
根据新的这套评估标准,大模型们的准确率平均下落了15%,其中比较广泛研究的CODEGEN-16B更是下落了超过18% 。
至于ChatGPT和GPT-4生成代码的性能,也下落了最少13% 。
不过 , 也有网友表示,大模型生成的代码效果没那么好,已经是“尽人皆知的事实”了,需要研究的是“为何大模型写的代码不能用” 。
关于本次LLM代码准确率平均降低15%的问题分享到这里就结束了 , 如果解决了您的问题 , 我们非常高兴 。
- ps4上古卷轴5秘籍大全 上古卷轴5升级代码?
- fc第二次机器人大战金手指代码_怎样使用《超级机器人大战α外传》金手指?
- ?交通违章代码7510是什么意思
- ?巴基斯坦首都机场叫什么?巴基斯坦首都机场三字代码
- 格力空调故障的常见错误代码
- 资源环境科学专业代码 ?资源环境科学专业就业前景
- 登录QQ时提示错误00001怎么解决 ?电脑登录qq错误代码00001
- 辨别真假vivo手机代码大全
- 格力空调E6故障代码维修实战分享
- 《雷神之锤3》中平方根算法你见过吗,这段代码简直吊炸天!