专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
今天看啥  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250508

腾讯研究院  · 公众号  · 科技媒体  · 2025-05-08 00:01
    

主要观点总结

文章介绍了关于生成式AI的最新进展,包括Google Gemini 2.5 Pro在基准测试中的表现,ComfyUI的新功能,Kevin模型的开源及强化学习生成CUDA内核的进展,以及针对学生群体的软件免费开放等政策。此外,文章还涉及腾讯元宝的对话分组功能升级,DeepSeek的文生图功能增强,Anthropic推出的AI for Science计划,机器人大模型的开源进展,科学家关于AI取代人类的警告,以及Bolt.new CEO对软件构建方式将被重构的观点等。

关键观点总结

关键观点1: Google Gemini 2.5 Pro在基准测试中全面领先,编程性能超越Claude 3.7。

Gemini 2.5 Pro的新版本特别强化了编程能力,可将图片、视频直接转化为交互式应用。开发者可通过Google AI Studio和Vertex AI使用更新版本,支持Canvas等功能。

关键观点2: ComfyUI支持主流图像和视频模型API的调用,完成品牌视觉更新,推出新功能。

ComfyUI新增原生API节点功能,可直接调用多个付费模型。新Logo采用连接方块元素设计,融入90年代动漫与Y2K风格。即将推出用户自定义API Key、工作流并行执行等功能。

关键观点3: Devin开发商开源的Kevin模型在生成CUDA内核方面表现出色。

Kevin模型基于QwQ-32B通过GRPO强化学习训练,多轮训练方法解决了上下文爆炸和奖励分配问题。模型通过反馈优化内核代码,实现加速比提升。

关键观点4: Cursor Pro和Gemini Pro向学生免费开放使用一年。

这场战略布局旨在争夺未来市场份额,学生通过官方链接可申请完整版本权限。

关键观点5: 腾讯元宝推出对话分组功能,支持历史对话归类整理。

每个分组可设置独立的提示词指令和定制功能。该功能已全平台上线,免费且不限次数。

关键观点6: Anthropic推出AI for Science计划,支持科学研究和发现。

该计划向入选研究人员提供API积分,重点支持生物系统、遗传数据等领域的研究应用。

关键观点7: 清华ISRLab与星动纪元联合开发AIGC机器人大模型VPP获ICML2025 Spotlight。

VPP基于视频扩散模型训练,可跨本体学习,在真实场景中完成多种任务。

关键观点8: 科学家警告AI正在让我们变得「无关紧要」。

随着AI变得更便宜可靠,其在经济、文化和社交领域逐步取代人类。专家建议采取四项措施应对。

关键观点9: Bolt.new CEO表示我们正处在软件构建方式将被完全重构的零点。

Bolt.new主打基于浏览器的快速Web应用开发,通过Web containers技术实现快速启动开发环境。


文章预览

生成式AI 一、  谷歌Gemini 2.5 Pro(I/O版)AI编程屠榜,碾压Claude? 1. Gemini 2.5 Pro登顶LMeana,首次在文本、视觉、WebDev Arena三大基准测试中全面领先,编程性能超越Claude 3.7; 2. 新版本特别强化编程能力,可将图片、视频直接转化为交互式应用,VideoMME测试得分84.8%; 3. 开发者可通过Google AI Studio和Vertex AI使用更新版本,已在Gemini App正式上线,支持Canvas等功能。 https://mp.weixin.qq.com/s/9kUkpgIdL4J1VY8O29RHDg 二、  ComfyUI 可直接在工作流中调用主流图像和视频模型API  1. ComfyUI新增原生API节点功能,支持10个以上模型系列和62个新节点,可直接调用Veo2、Flux Ultra等付费模型; 2. 完成品牌视觉更新,新Logo采用连接方块元素设计,融入90年代动漫与Y2K风格,配色方案全面升级; 3. 即将推出用户自定义API Key、工作流并行执行等功能,同时增强了视频处理能力。 https://mp.wei ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览