今天看啥  ›  专栏  ›  AI科技评论

Agent 要被吃进大模型了

AI科技评论  · 公众号  ·  · 2025-04-17 16:07
    

文章预览

OpenAI 做 Agent,得天独厚。 作者丨郑佳美 编辑丨马晓宁 今天凌晨,奥特曼突然发文宣布推出自家最新的 o 系列模型: 满血版 o3 和 o4-mini, 同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网络搜索、Python。 总的来说,就是比前一代的 性能更强而且价格更低 。 消息一出,马上就有网友晒出了两个模型的“小球测试”结果,并配文:“这确实是迄今为止看到的最好的测试结果了。” 也有网友晒出了满血版 o3 和 o4-mini 在 HLM 基准的中的排名,其中 OpenAI 的两款新模型仅用了几个小时的时间就稳稳的“盘”上了榜单前三,引得网友大呼震惊。 1 o3 与 o4 mini 全面进化 除了网友们的测评结果外,我们也来看一下 OpenAI 给出的两个模型的官方数据。 首先,o3 在多个基准测试中表现优异,包括 Codeforces、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览