文章预览
字节提出一种即插即用的快速个性化生成方法-MoMA。不需调优,只需一张主体的图像(下图蓝色圈出),就可以生成文本对齐的、保留身份的同一主体的新图像,只需要一次向前传递。我们的模型既支持重新语境化,即相同的主题位于新环境中,如绿色所示,也支持改变主题本身的纹理,如红色所示。 相关链接 论文:https://arxiv.org/pdf/2404.05674 主页:https://moma-adapter.github.io/ Code:https://github.com/bytedance/MoMA/tree/main Demo:https://huggingface.co/KunpengSong/MoMA_llava_7b 论文阅读 MoMA:快速个性化图像生成的多模态LLM适配器 摘要 在本文中,我们提出了MoMA:一个开放词汇,无需训练的个性化图像模型,具有灵活的零拍摄功能。随着基础文本到图像模型的快速发展,对稳健的图像到图像翻译的需求也在增长。 为了满足这一需求,moma专注于主题驱动的个性化图像生成。利用
………………………………