首页 互联网 > 正文

质疑大数据在人工智能中的长期重要性

在当今的数字经济中,没有任何资产比数据更有价值。称数据为“新石油”已经到了老生常谈的地步。正如最近《经济学家》杂志的标题所说,数据是“世界上最有价值的资源”。

因为数据在促进机器学习和人工智能解决方案方面起着至关重要的作用,所以今天的数据受到高度重视。从网飞的推荐引擎到谷歌的无人驾驶汽车,训练一个有效的人工智能系统需要大量数据。

因此,人们对越来越大的数据非常着迷。根据流行的观点,谁拥有最多的数据,谁就能构建出最好的人工智能。从IBM到通用电气的老牌公司都争先恐后地将自己更名为“数据公司”。软银的愿景基金(Vision Fund)是全球最大、最具影响力的科技投资者,这毫不掩饰寻找创业支持的重点是数据资产这一事实。用软银领导人孙正义的话说,“谁统治了数据,谁就统治了世界”。

随着商业和技术界越来越多地将数据定位为最终的赢家,人们越来越少关注这个重要的现实:人工智能的未来可能会大大降低数据强度。

在人工智能的前沿,人们正在进行各种努力,以开发一种不需要大量标记数据集的改进形式的AI。这些技术将重塑我们对人工智能的理解,并以一种深刻的方式摧毁商业格局。行业领袖最好注意一下。

今天,为了训练深度学习模型,从业者必须收集数千、数百万甚至数十亿个数据点。然后,他们必须给每个数据点贴上标签,这是一个昂贵且通常是手动的过程。如果研究人员不需要费力地收集和标记真实世界的数据,而是可以从头创建他们需要的精确数据集,会怎么样?

领先的技术公司(从Nvidia等知名竞争对手到Applied Intuition等初创公司)正在开发以几乎完全免费的方式完全数字化地生产高保真数据的方法。这些人工创建的数据集可以根据研究人员的确切需求进行定制,并且可以包含数十亿个备选方案。

英伟达模拟技术总监迈克斯科洛内斯(Mike Skolones)表示,“走出去改变现实世界中的照明是非常昂贵的,而且你无法改变户外场景中的照明。”但是可以用综合数据。

随着合成数据精确地接近真实世界的数据,它将使人工智能民主化,并削弱专有数据资产的竞争优势。如果一家公司可以通过模拟快速生成数十亿英里的真实世界驾驶数据,那么Waymo十年收集的数百万英里的真实世界驾驶数据有多大价值?在这个可以按需廉价生成数据的世界里,跨行业的竞争态势将被颠覆。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。