英特尔研究院发布全新 AI 扩散模型 可根据文本提示生成 360 度全景图

机器人技术 2025-03-25 16:09www.robotxin.com机器人技术

英特尔研究院在近日携手Blockade Labs发布了一项革新性的技术——LDM3D(Latent Diffusion Model for 3D)。这项全新的扩散模型利用生成式AI技术,为我们带来了前所未有的3D视觉体验。

这一模型的强大之处在于,它能够通过扩散过程生成深度图,进一步构建出逼真的、沉浸式的360度全景图。这一技术的出现,将有望引领内容创作、元宇宙应用以及数字体验的新纪元,对娱乐、游戏、建筑和设计等众多行业带来深远的影响。

据了解,LDM3D的诞生离不开庞大的数据集支持。它是以LAION-400M大型图文数据集为基础,经过严格筛选,选取了一万个样本的子集进行训练。标注训练语料库时,研究团队借助了英特尔研究院先前开发的稠密深度估计模型DPT-Large,为每个像素提供了高度精准的相对深度。LAION-400M数据集的创建,旨在为研究人员和广大兴趣社群提供一个更大的测试平台,以推动模型训练的进步。

值得一提的是,LDM3D模型的训练是在英特尔AI超级计算机上完成的。这台超级计算机由英特尔至强处理器和英特尔Habana Gaudi AI加速器共同驱动,确保了模型的运行效率和准确性。最终,通过整合RGB图像和深度图,LDM3D成功生成了360度全景图,为我们带来了真正的沉浸式体验。这一技术的突破,无疑将为我们打开一个全新的数字世界大门。

上一篇:人机PK 一触即发你准备好了吗 下一篇:没有了

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by