很多文章的报道都是由微观而宏观,今日小编讲给大家带来的关于Facebook开源PyTorch3D以实现从三个角度思量的AI的资讯也不例外,希翼可以在一定的程度上开阔你们的视野!y有对Facebook开源PyTorch3D以实现从三个角度思量的AI这篇文章感兴趣的小伙伴可以一起来看看
Facebook Inc.的研究部门周四公布了PyTorch3D的代码,PyTorch3D是一种自产的工具包,旨在简化可在三维环境中运行的人工智能模型的开辟。
在或至少了解3D空间的能力对于跨多个领域的深度学习应用至关重要。最明显的领域是机器人技术,虚拟现实和增强现实。即使是分析对象二维照片的传统图像识别模型,也可以从了解对象的真实三维形式中受益,因为额外的上下文可能有助于提高其准确性。
但是,由于Facebook说缺乏专用开辟工具,因此在释放3D深度学习优势方面的发展相对缓慢。借助PyTorch3D,社交网络的研究人员正在寻求解决差距并降低学习曲线,以在应用程序中实施该技术。
PyTorch3D的第一个组件是称为网格的数据结构。数字3D模型由所谓的网格组成,这些网格具有多种不同的类型,可能很难使用。Meshes结构提供了用于组织这些形状的统一格式,Facebook表示,这使AI开辟人员更轻松地处理其数据。
开辟人员可以使用Facebook包含在PyTorch3D中的一组损失函数和运算符来构建AI模型来处理其3D模型。损失函数是用于跟踪AI在数据集上进行训练时所犯错误的算法,该信息有助于引导学习过程朝正确的方向进展。操作员本质上是在编写用于执行复杂任务的快捷方式,在这种情况下,涉及3D对象的计算。
Facebook研究人员Nikhila Ravi,Georgia Gkioxari和Justin Johnson在博客中写道:“我们已经完成了优化3D数据的几种常见运算符和损失函数的实现的工作,从而支持了不同批次的输入 。” “随着时间的推移,我们将继续增加一组通用运算符。”
Facebook已通过渲染引擎增强了PyTorch3D的功能集,该引擎将3D数据转换为2D图像,开辟人员可以查看或应用程序对其进行处理。渲染器不仅可以生成对象,还可以添加照明和阴影效果。它具有一个应用程序编程接口,该接口同意 将项目导出到流行的深度学习框架中,例如Facebook开辟的PyTorch(该工具包的同名产品)。