看啥推荐读物
专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑

新智元  · 公众号  · AI  · 2024-04-25 13:54
  新智元报道  编辑:LRS【新智元导读】颜水成团队联合新加坡国立、南洋理工大学共同开源了Vitron模型,持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,为下一代通用视觉大模型的终极形态奠定了基础,也标志着大模型迈向通用人工智能(AGI)的又一大步。近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。项目主页&Demo:https://vitron-llm.github.io/论文链接:https://is.gd/aGu0VV开源代码:https://github.com/SkyworkAI/Vitron这是一款重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑等任务的像素级通用视觉多模态大模型,为下一代通 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照