今天看啥  ›  专栏  ›  硅星GenAI

腾讯研发了快一年的混元文生图模型,说开源就开源了?

硅星GenAI  · 公众号  ·  · 2024-05-15 18:05
作者|周一笑邮箱|zhouyixiao@pingwest.com文生图模型成熟之后,有多少人苦练Midjourney咒语,还是调不出可用的图像?设计界的专业名词、不太准确的英文翻译、理解不了的中国古代建筑充斥在目前文生图工具中。本质上是源于国内很多团队基于翻译+英文开源Stable Diffusion模型,或者基于少量的中文数据在一些特殊的场景做了finetune,而这两种方式都存在对中文理解不足和不通用的问题。针对这些痛点,腾讯带着中文原生的文生图大模型来了。5月14日,腾讯宣布开源混元文生图大模型,是国内首个中文原生的DiT架构模型,具备中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。比如同样是含有“昆曲”、“狗不理包子”关键词的Prompt,对比不同对文生图模型,混元生成了最匹配对图片:为了进一步降低了用 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照