数字化转型方略 第9期 2021/05/31

微软 Build 2021:展示Power BI与Cosmos DB最新功能

微软的年度开发人员活动——Build大会在数据和分析方面没有带来任何革命性的变化,但是在新的进化功能和服务方面,微软交出了一份长长的清单。

微软Build开发者大会——Build 2021,又回来了!现在,即使是线上的活动也形成了一年一度的新传统不过,微软还保持了另一项由来已久的传统,就是利用Build开发人员大会来宣布公司在数据和分析方面的新进展。

今年,尽管微软本身并没有带来突破性的新闻,但是在云端的BI和数据库产品方面,微软交出了长长的清单,里面列举了很多新功能和新服务,这些内容也非常令人印象深刻。

全程强大的数据流和聚合

让我们从微软的Power BI公告开始。公告包含了处理从数据来源(Azure IoT Hub和Azure Event Hubs)获得数据流的Power BI数据流功能(云端的功能就是Power Query)。微软的团队承诺称,它将让流数据和实时分析像批处理数据和常规分析一样易于使用——不仅仅是针对BI专家和数据工程师,还可以适用于商业用户。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引发了一个问题,即该功能是否有一天可以与该开源流事件平台一起工作。

另一个有趣的功能被称为自动聚合。要了解此功能,你必须了解作为其基础的基本聚合功能。基本聚合功能使你可以在度量的基础上预先计算聚合,从而获得出色的性能,特别是针对那些Power BI已经通过DirectQuery连接了的数据源时,更是如此。DirectQuery可以从后端数据源获取数据。

通过聚合,Power BI可以避免一直到后端获取通用汇总数据,而将这种方式保留给相对较少的详细数据集。聚合的问题在于,用户必须在建模Power BI要查询数据的时候设计聚合。这里有一个好消息,自动聚合功能将根据实际观察到的查询模式自动构建这些算法,随着收集到的此类观察结果数量的增加,它的表现还会变得越来越好。

数据流和自动聚合的预览版本都将在7月发布,这两个功能都是Power BI Premium专有的。由于Premium现在是按用户提供服务,用户需要在Power BI Pro的基础上每个月多支付10美元以使用Premium功能。因此这些功能和更多的用户都相关。同时,另一项Premium功能——Power BI部署管道(Power BI deployment pipelines)——可以获取面向开发人员的自动化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,让它们可以自动化地部署Power BI资产。自动化API(Automation APIs)现在已经可以使用了。

这里有很多只针对Premium用户的功能,而“高级用户”的定价意味着我们将会看到更多这样的功能。同时,微软还发布了一个很酷的新功能,该功能允许将Power BI报告被内嵌到Jupyter笔记本中——作为开源Python包。而且它与Power BI Pro兼容,包括可免费试用的版本。下图是一个装有Power BI的Jupyter笔记本的图片。

COSMOS DB:无服务器、缓存、加密和免费

在数据库方面,微软发布了很多关于Cosmos DB的消息,还有一些是关于MySQL和Postgres的零散消息。

首先,是Cosmos DB——微软的大规模多模型托管NoSQL数据库。微软将无服务器选项纳入了Cosmos DB的通用可选范围之内,并包含Cosmos的很多API,将它的云原生谱系拓展了一步。无服务器版本的Cosmos DB让用户可以在无需提供显式规模集群的情况下使用它,因此能够更好地应对微软所谓的“尖峰流量模式”。即使对于习惯了集群规模调整的客户来说,这种无服务器的选项也将在实质上提供零维护的自动规模调整。毕竟,无服务器的信条是让服务承担在你需要的时候为你分配资源的责任。

Cosmos也获得了很多新功能,那些熟悉旧式关系型数据库的专业人员们可能会喜欢这些功能。其中包括集成的缓存,基于角色的访问控制(RBAC)和始终加密(Always Encrypted)——这是一个源自SQL Server和Azure SQL数据库的功能,在数据被存入数据库之前,就在应用程序内进行完全加密。集成的缓存服务特别有趣,因为它不仅可以提高性能,而且可以通过减少对数据库的完整读取来节省资金。微软表示,缓存可以降低成本,并将大量读取工作负载的性能分别提高多达96%和300%。

Cosmos DB还扩展了它的免费功能。新产品为开发人员提供每个月1,000 RU/s(每秒请求单位)的预配置吞吐量和25GB的免费存储空间。谈到免费——微软已经在这个方向努力了一段时间了,该公司提供了Cosmos DB仿真器,它让开发人员能够在正常工作的Cosmos DB实例上运行其代码,而且无需支付任何云费用。以前,该仿真器只能在Windows计算机上运行,但是微软今天发布了该仿真器的Linux版本,它也可以运行在Mac机器上。像Cosmos DB Serverless一样,新发布的免费功能都已经全面上市。同时,集成缓存、始终加密(Always Encrypted)和Linux仿真器推出了预览版。

回到关系数据库的世界,微软宣布将从六月开始提供12个月免费的Azure Database for PostgreSQL和Azure Database for MySQL Flexible Server,微软将为使用Azure免费帐户的用户每个月提供最多750个小时的免费服务。此外,对于Azure Database for PostgreSQL——Hyperscale (Citus)这个新推出的免费功能预览版,微软将提供基于单节点部署的入门级功能。至少可以说,对于单节点部署来说,无论如何都很难说得上有“超大规模”,所以最好用和Cosmos DB仿真器相同的方式来对待它——作为开发和测试代码的一个工作端点。区别在于它可以就地生产,因为微软提供了后续增加工作节点并进行扩展的选项。

本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码

《数字化转型方略》杂志