DreamFusion
2D转3D AI图像工具 AI绘图
DreamFusion

使用2D扩散将文本转换为3D图像,给定一个标题,DreamFusion生成具有高保真外观、深度和法线的可重定向3D对象。对象被表示为神经辐射场,并利用预先训练的文本到图像扩散。

给定一个标题,DreamFusion生成具有高保真外观、深度和法线的可重定向3D对象。对象被表示为神经辐射场,并利用预先训练的文本到图像扩散。

官网摘要:

文本到图像合成的最新突破是由在数十亿图像-文本对上训练的扩散模型驱动的。将这种方法应用于3D合成将需要标记的3D资产的大规模数据集和用于对3D数据进行去噪的高效架构,这两者目前都不存在。在这项工作中,我们通过使用预训练的2D文本到图像扩散模型来执行文本到3D合成来规避这些限制。我们介绍了一种基于概率密度蒸馏的损失,使使用的2D扩散模型的参数化图像生成器的优化的先验。在类似DeepDream的过程中使用这种损失,我们通过梯度下降优化随机初始化的3D模型(神经辐射场,NeRF),以便其随机角度的2D渲染实现低损失。所得到的给定文本的3D模型可以从任何角度查看,通过任意照明重新照明,或合成到任何3D环境中。 我们的方法不需要3D训练数据,也不需要修改图像扩散模型,证明了预训练的图像扩散模型作为先验的有效性。

相关导航

chartgpt
免梯子 | 部分免费 | 非中文

一款图表格式输出的GPT

网页
Claude 2.0
免费 | 需梯子

Claude 2是一个功能强大的人工智能助手,擅长处理文本、文件上传、编程任务、创意写作、数据分析和大型文本处理。它能够处理各种文本文件,包括PDF和Word文档,并从其内容中获取见解。

网页
Hansei
免梯子 | 部分免费

使知识库的访问变得更加简单,通过自然语言查询,使其在企业内部和与客户的交互中都能发挥作用。

Splash
免梯子 | 部分免费

Splash Pro是一个 AI 音乐生成器。用户可以通过输入简单的文本提示来快速创建歌曲。此外,该网站还提供了使用生成 AI 声乐将自定义的唱歌或说唱声音添加到歌曲中的功能。

网页
博特妙笔
免梯子 | 部分免费

国内首款AIGC大模型公文写作平台。集查、写、审、学为一体,通过AI生成、润色、校对、续写、灵感和丰富的公文写作素材、范文、模板数据库,为公职人员公文写作提效

网页
万相实验室
付费 | 免梯子

万相实验室是阿里妈妈推出的一款电商领域的AI创意生产工具。通过AI技术,该实验室帮助商家在推出新产品时实现“0成本适配模特、0成本创造场景、30秒批量创造高规格商品图”,解决了素材生产和上新结果差的问题。

网页

发表回复