首页 互联网 > 正文

Verta.ai宣布发布ModelDB 2.0

Verta Enterprise(一个开放的端到端MLOps平台)的提供商Verta.ai宣布推出面向机器学习的开源模型版本控制系统(ML)ModelDB 2.0,该系统在开发和部署方面可靠、安全、可复制。

在一个快速发展的领域,缺乏操作和控制模型的基础设施,ModelDB 2.0提供了跟踪和版本化整个建模过程(包括基础数据和培训配置)的能力,从而确保团队可以随时返回并重新创建模型,以补救生产事故或回答监管问题。

“在保险行业,很多模型都要提交监管部门审核备案。然而,创建模型的过程更像是研究。这需要时间,而且是暂时的。对我们的团队来说,记录和复制模型是一项艰巨的任务,精算师花了几周时间来回答监管部门的问题。因此,对于我们和许多受监管的公司来说,让模型和分析具有可重复性对我们的业务至关重要。”Cambridge Mobile Telematics首席科学家塞缪尔马登(Samuel Madden)表示,Cambridge Mobile Telematics是一家领先的保险科技公司,使用数据和ML来提高驾驶员的安全性。

ModelDB 2.0领先模型版本控制,类似于代码的源代码版本控制。

虽然软件中有健壮的系统可以用于关键操作,比如源代码管理、敏捷交付和运营;ML模型缺少这些系统,这就挑战了公司将ML整合到核心产品中。

ModelDB 2.0完全重新考虑了模型版本系统应该提供什么,应该如何构建。Verta的ModelDB 2.0使用来自代码版本控制系统(如Git)的最佳构造,并使它们适应复制ML模型的特殊要求,以便ML模型可以完全被管理、审计、版本化和协作。

ModelDB 2.0已经获得了Apache V2的许可,现在已经可以普遍使用了。它为开源社区提供了以下新特性:

能够对模型的关键元素进行版本控制,包括代码、数据、配置和环境。

能够使用ModelDB协议复制任何版本的模型。

集成到流行的ML框架中,如PyTorch、Tensorflow和scikit-learn。

通过认证、授权、组织和团队进行用户管理

Verta.ai的ModelDB 2.0帮助组织将敏捷性引入数据科学。

麻省理工学院开发的ModelDB的第一个版本侧重于跟踪模型元数据(例如,谁创建了模型,用于模型训练的确切配置等。),许多研究和商业系统继续采用ModelDB引入的这种方法。然而,多年来构建和部署ML模型的经验以及在受监管行业工作的机会向Verta团队强调了这种方法的缺点。

“尽管元数据很有用,可以告诉你诸如谁建立了一个特定的模型之类的信息,但它不提供回到过去并重新创建模型来回答监管问题的能力。随着模型做出关键的商业决策,行业要求我们在模型的创建和使用方式上承担更大的责任和安全性。

版本控制为下游MLOps(如打包、部署、操作和监控)提供了坚实的基础。Verta看到了将Verta Enterprise置于ModelDB强大的模型版本控制系统中的优势。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。