专栏名称: 机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
今天看啥  ›  专栏  ›  机器之心SOTA模型

今日开源(2025-04-28):Step1X-Edit,19B多模态图像编辑模型,媲美GPT-4o,结合DiT的解耦式架构

机器之心SOTA模型  · 公众号  ·  · 2025-04-28 22:57
    

文章预览

🏆基座模型 ①项 目: Step1X-Edit ★ Step1X-Edit 是一个先进的图像编辑模型,旨在提供与闭源模型(如 GPT-4o 和 Gemini2 Flash)相媲美的性能。 该模型采用多模态大语言模型(LLM)来处理参考图像和用户的编辑指令, 通过提取潜在嵌入并与扩散图像解码器集成来生成目标图像。 项目通过构建数据生成管道来生产高质量数据集,并开发了一个名为 GEdit-Bench 的新基准进行评估。实验结果表明,Step1X-Edit 在 GEdit-Bench 上的表现优于现有的开源基线,并接近领先的专有模型。 ☆一键收藏: https://sota.jiqizhixin.com/project/step1x-edit 🤖 Agent开发 ①项目: VoltAgent ★ VoltAgent是一个开源的TypeScript框架,专为构建和编排AI智能体而设计。它提供了基础结构和工具,简化了AI智能体应用的开发过程。 通过提供模块化构建块、标准化模式和抽象,VoltAgent帮助开发者快速创建聊天 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览