就在今天早上,谷歌在其年度云计算大会上宣布了数据库的改进。同时,山景公司也宣布了一系列数据分析的新功能。
首先是云数据融合,这是一个完全托管的云本地数据集成服务,本周开始测试。谷歌通过使用开源转换库和100多个连接器,将其作为获取、集成和操作数据的一种方式。它们主要通过拖放界面来控制,在该界面中,数据集和管道是可视化的,无需代码。
谷歌还推出了测试版的Data Catalog,这是一种完全托管和可扩展的元数据管理服务,具有用于数据发现的搜索接口,并支持Gmail和Drive搜索技术。它有一个用于捕获技术和业务元数据的编目系统,并与cloud DLP和cloud IAM集成,以实现特权访问和控制。
在BigQuery方面,谷歌表示,它建立了一个数据仓库迁移服务,以自动化从Teradata和亚马逊Redshift到BigQuery的数据和模式迁移,以及从亚马逊S3加载数据。它还公开了BigQuery BI Engine,这是一种快速内存分析服务,旨在以“亚秒级”查询响应时间和高并发性处理复杂数据集。
还有一个新功能,connected sheets,这是一个谷歌工作表电子表格,可以处理BigQuery多达100亿行的完整数据集。(BigQuery从2016年开始可以从Google Sheets中获取数据,但只是在一定程度上。)与SQL相反,连接表中的分析是使用公式、数据透视表和图表来执行的,它们可以被可视化为仪表板,并与组织中的任何人共享。
从今天开始,BigQuery BI引擎可以通过Google Data Studio进行测试,用于交互式报告和仪表板。谷歌表示,在未来几个月,Looker和Tableau也将能够使用它。连接表稍后会到达。
在其他BigQuery新闻中,BigQuery ML促进了BigQuery内部数据集上AI模型的部署,正在获得新的模型,如k-means聚类(beta版)和矩阵分解(alpha版)。现在可以建立并直接导入TensorFlow深度神经网络模型(在alpha中)。此外,谷歌还表示,其BigQuery数据传输服务可以定期自动将数据从SaaS (SaaS)应用程序传输到谷歌BigQuery,目前支持超过100个应用程序,包括Salesforce、Marketo、Workday和Stripe。
谷歌云产品管理总监Sudhir Hasbe表示,“从《财富》 500强企业到初创企业,越来越多的企业持续关注云技术,以帮助他们存储、管理数据并从数据中获得深刻的见解。”“我们将继续开发新的变革工具来帮助他们做到这一点。”