专栏名称: 小白学视觉
本公众号主要介绍机器视觉基础知识和新闻,以及在学习机器视觉时遇到的各种纠结和坑的心路历程。
目录
今天看啥  ›  专栏  ›  小白学视觉

鸡哥又上CV论文!单图生成3D模型,高质量且高效率新模型!

小白学视觉  · 公众号  ·  · 2024-06-27 10:05
    

文章预览

点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 大家好,今天和大家分享几篇最新的工作 1、 VividDreamer VividDreamer 是一个兼顾高质量和效率的文本生成3D资产的算法。更加具体来说就是,通过输入一句话,例如下图左上角的图片:输入 “A zoomed out DSLR photo of a corgi wearing a top hat” (戴着高顶礼帽的柯基犬的缩小照片),生成 柯基的3D模型。 实现思路: VividDreamer 的整体框架: 1、使用预训练的 Point-E(3D点云)和文本prompt初始化,并使用 3D Gaussian Splatting (3DGS) 作为 3D 表征 2、 在训练中,给定一个相机姿势 c,通过 3DGS 的渲染管道渲染相应的视图,并使用 DDPM/DDIM 反演将其扰乱为 2D 扩散模型 (扩散过程) 3、 采用提出的姿势相关一致性蒸馏采样 (PCDS),通过几步(1-3)采样,将噪声映射到伪GT(例如 去噪后的图片) 4 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览