苹果推出了名为 sharp(sharp monocular view synthesis)的全新研究成果与模型,仅需一张常规二维照片,即可在亚秒级时间内生成高度逼真的三维场景视图。
据悉,SHARP 基于前沿的 3D 高斯泼溅(3D Gaussian Splatting)技术,将整个场景建模为海量具备颜色与光照属性的 3D 高斯椭球体。该模型通过单次神经网络前向传播(feedforward inference),直接预测出数以百万计的高斯单元的空间位置及其外观特征,从而高效构建出具备真实感的三维结构。


区别于依赖多视角图像输入或耗时迭代优化的传统方案,SHARP 实现了“单图输入、瞬时输出”的能力,所生成的三维结果不仅维持精确的空间比例与深度关系,还支持符合真实尺度的相机自由移动。在多个主流基准数据集上,其在图像保真度指标(如 LPIPS、DISTS)方面均超越当前最优方法,推理速度更提升约三个数量级(1000×)。
苹果已正式开源 SHARP 的完整代码与预训练模型权重,托管于 GitHub:https://www.php.cn/link/5ec8b136da1b014682313777cb7a82ee
源码地址:点击下载
以上就是苹果发布开源 AI 模型 SHARP,将单张 2D 照片快速变成 3D 场景的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号