GLM-4-9B领先！伯克利函数调用榜单BFCL的Function Calling评测方法解析与梳理

智见AGI · 公众号 · · 2024-06-05 17:35

文章预览

智谱公布的GLM-4-9B基于BFCL榜单的工具调用能力测试结果 ©作者 | 格林来源 | 神州问学在智谱最新开源的GLM-4-9B-Chat中，其工具调用能力在BFCL（伯克利函数调用排行榜）榜上获得了超高的总BFCL分，和gpt-4-turbo-2024-04-09几乎不相上下。在榜单中，还提到了AST总分以及Exec总分两个得分，那么这两个得分有什么含义，又是如何计算的呢？引言智能体应用开发逐渐成为各大AI厂商应用开发平台不可或缺的一部分，不同平台会提供各类型的插件来拓展智能体的能力范围。随着能力的提升，模型能够完成并胜任的任务种类越发丰富，其中就包括了函数调用（Function Calling）的能力。我们可以看到，现在国内外许多模型厂商都在强化自家模型函数调用的能力，包括智谱最新发布的 GLM-4-9B-C hat 、百川的Baichuan4、阿里的Qwen系列、上海人工智能实验室的InternLM2等等。通 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博