(资料图片)

导读 来自AIRI 人工智能研究所、Skoltech、MEPhI、纽约大学和慕尼黑工业大学的国际研究人员团队展示了一个为多视图 3D 重建设计的大型数据集...

来自AIRI 人工智能研究所、Skoltech、MEPhI、纽约大学和慕尼黑工业大学的国际研究人员团队展示了一个为多视图 3D 重建设计的大型数据集。

它包含 139 万张图像,用于改进从照片创建 3D 模型领域的人工智能。您可以在此处访问数据集。

为了简化人工智能算法的开发和评估,科学家们发布了这个新数据集,其中包含来自各种 RGB 和深度传感器的图像,包括智能手机、英特尔实感、工业相机和结构光扫描仪。通过专门的设置和受控照明,研究人员收集了 107 个小物体的 139 万张图像。

一篇描述数据集准备过程的文章发表在计算机视觉和模式识别 2023 会议上。那里还进行了一项研究,表明 3D 重建工作在很大程度上取决于感官数据的类型。

通常,计算方法的开发适用于特定类型的数据,这缩小了它们的应用范围。例如,摄影数据可以提供高度精确的几何图形,但恢复视觉上均匀的场域(如单色墙)是一项挑战。然而,在人工智能的帮助下结合不同类型的感官数据可以解决这个问题。

研究发现,表面反射率特性与 AI 生成的重建质量相关。发现具有大量纹理或不透明细节的对象更适合质量重建。

标签:

版权声明:本文由用户上传,如有侵权请联系删除!


关键词: