专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

从部分到整体:可控人体图像生成的统一参考框架

将门创投  · 公众号  · 科技创业  · 2024-05-23 21:21
在人体图像可控生成领域,尽管在控制姿态和人物身份等方面取得了显著进展,但要通过不同人体部位实现精准控制仍面临重大挑战,尤其是在涉及多重可控条件时,控制效果往往难以保证。针对这一问题,北京航空航天大学的研究团队提出了一种新颖的研究方法“从部分到整体”(Parts2Whole)。这项技术能够利用多个参考图像,包括姿势图和不同的人体部位外观,生成高度可控的人体图像。该研究方法的核心在于其创新的语义感知外观编码器,共享自注意力机制和掩膜引导的主题选择机制,使得从多个参考图像中精确抽取目标特征成为可能。论文标题:From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation 论文链接:https://arxiv.org/pdf/2404.15267代码链接:https://github.com/huanngzh/Parts2Whole项目主页:https://huanngzh.github.io/Parts2Whole/一、Parts2W ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照