文章预览
前言 本文设计了一种由大语言模型驱动的、可集成任意数量视觉模型的交互式三维场景编辑框架,其文本形式不再受限、编辑能力不再单一。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 来源: 机器之心 仅用于学术分享,若侵权请联系删除 项目地址:https://sk-fun.fun/CE3D/ 代码:https://github.com/Fangkang515/CE3D/tree/main 论文:https://arxiv.org/abs/2407.06842 机构: 北航 & 谷歌 & 旷视 1. 一句话概括 本文设计了一种由大语言模型驱动的、可集成任意数量视觉模型的交互式三维场景编辑框架,其文本形式不再受限、编辑能力不再单一。 (对话式 3D 场景编辑过程示例视频) 2. 引言 现有的文本驱动 3D 场景编辑方法通常 局限于固定的文本输入形式和受限的编辑能力 。
………………………………