蔚蓝 SQL数据仓库和Power BI

蔚蓝 SQL数据仓库和Power BI

毫无疑问,云计算将极大地改变数据分析和数据可视化的未来。 Microsoft 蔚蓝 SQL数据仓库最近发布以供公众预览。将Power BI作为强大的数据可视化工具与Azure SQL数据仓库相结合,将使用户能够非常轻松地查看其存储在Azure数据仓库中的数据的数据见解。在这篇文章中,我将说明如何安装Azure SQL数据仓库及其与Power BI的配合方式。在继续进行下一步之前,我想简要介绍一下Azure SQL数据仓库。

什么是Azure SQL数据仓库?

根据Microsoft文档,SQL数据仓库是

蔚蓝 SQL数据仓库是一种企业级分布式数据库,能够处理PB级的关系和非关系数据。

蔚蓝 SQL数据仓库支持存储过程,用户定义的函数,索引和排序规则。它使用列存储索引技术,与传统的基于行的索引相比,该技术显着提高了查询性能,并使您的压缩率提高了5倍。

我留给您了解有关Azure SQL数据仓库的更多信息。但是,请务必记住一些功能,例如 蔚蓝 SQL数据仓库中不支持的主键和外键 这会影响我们将Power BI用作Azure SQL数据仓库上的数据可视化工具的方式。没有主键和外键,表之间就没有物理关系,因此Power BI服务本身无法检测到任何关系。有一个解决方法,我们可以在Azure端创建一些SQL视图以使其工作。这可能是一个昂贵的解决方案。另一种方法是将数据仓库加载到Power BI Desktop模型中,该模型可以自动检测关系。

现在,您已经对Azure SQL数据仓库有所了解,让我们回到主题,并进一步讨论Power BI和Azure SQL数据仓库。

首先是第一件事。您需要具有Microsoft 蔚蓝订阅。如果你不这样做’它已经没有了,您可以将其用于 在这里试用一个月。您’还将获得$ 250的赠送金额。但是,请记住,如果您在不到一个月的时间内成功获得了250美元,’如果要使用更长的时间,则需要付费。

安装Azure SQL数据仓库

获得Azure订阅后, 登录到您的帐户 并且您应该看到这样的仪表板

安装Azure SQL数据仓库

I’我将不解释上述仪表板,因为它不在本文讨论范围之内。

  • 请点击New

安装Azure SQL数据仓库01

  • 请点击“Data + Storage” then click “SQL Data Ware House”

安装Azure SQL数据仓库02

  • 输入数据库名称
  • 选择a performance value

注意:更大的数据仓库单元值可通过更多计算资源来提高工作负载性能。请记住,价值越大,您支付的钱就越多。因此,对于我们的实验样品,我选择的最小可能值为“100”每小时的费用为我$ 0.70!是的,每小时。 --

  • 请点击“Server”配置所需的设置
  • 请点击“Create a new server”
  • 输入the server name
  • 输入“Server admin login”
  • 输入密码
  • 确认密码
  • 选择“Location”. The default is “East US 2”

安装Azure SQL数据仓库03

  • 到目前为止,我们已经配置了一个新服务器来托管我们的SQL数据仓库
  • 请点击OK
  • 现在我们可以看到服务器名称和位置出现在“Server” section

安装Azure SQL数据仓库05

  • 请点击“Select source”
  • 现在,您可以选择一个空白数据库或一个示例数据库。我选择“Sample”.

安装Azure SQL数据仓库06

  • 如你看到的“AdventureWorksDW:显示在“Select sample” section

安装Azure SQL数据仓库07

  • 请点击“Resource Group”
  • 请点击“创建一个新的资源组”
  • 输入新资源组的名称,然后单击“确定”。

安装Azure SQL数据仓库08

  • 现在我们配置了所有需要的设置,’准备创建新的Azure SQL数据仓库服务。请点击“Create”

安装Azure SQL数据仓库09

  • 现在轮到你’将在仪表板上看到一个新图标,显示正在创建SQL数据仓库

安装Azure SQL数据仓库10

现在,我们成功创建了一个新的Azure SQL数据仓库。

安装Azure SQL数据仓库11

但是,我们还没有完成。我们仍然需要配置防火墙设置,以便能够从Power BI Desktop,Excel等应用程序连接到数据仓库。

蔚蓝 SQL数据仓库服务防火墙设置

  • 请点击“All Resources” fro the dashboard
  • 从列表中单击您的Azure SQL数据仓库资源

蔚蓝 SQL数据仓库防火墙设置

  • 请点击one of the below for configuring firewall

蔚蓝 SQL数据仓库防火墙设置01

      1. 请点击“Add client IP”
      2. 确保“允许访问Azure服务” is switched to “ON”
      3. 您应该看到您的IP地址已添加到列表中
      4. 请点击“Save”

蔚蓝 SQL数据仓库防火墙设置02

注意:您可以添加一个IP范围,而不仅仅是一个IP地址。您只需要输入一个“Start IP” and an “End IP”地址,那么该IP范围内存在的任何设备都将能够访问Azure SQL数据仓库服务。

蔚蓝 SQL数据仓库防火墙设置03

为了能够从客户端应用程序连接,我们需要具有服务器名称。若要查找服务器名称,可以从仪表板上单击“ 蔚蓝 SQL数据仓库”。

蔚蓝 SQL数据仓库

然后单击“服务器名称”下的复制图标。

蔚蓝 SQL数据仓库 服务器 Name

如果在仪表板上没有看到您的Azure SQL数据仓库实例:

  • 请点击“SQL Databases”
  • 选择the database from the list
  • 复制服务器名称

蔚蓝 SQL数据仓库 服务器 Name 01

直接从Azure SQL数据仓库连接到Power BI

您可能已经注意到,Azure SQL数据仓库实例的顶部有一个“在PowerBI中打开”。

  • 请点击on the “Open In PowerBI” button

蔚蓝 SQL数据仓库和Power BI

  • 它将您重定向到Power BI网站,打开“连接到Azure SQL数据仓库”连接,并自动填充服务器和数据库名称。点击下一步。

蔚蓝 SQL数据仓库和Power BI 01

  • 输入您先前在Azure SQL数据仓库中创建的管理员用户名和密码,然后单击“登录”:

蔚蓝 SQL数据仓库和Power BI 02

现在,我们已将Azure SQL数据仓库成功连接到Power BI。

创建 a 样品 Report on Power BI 网页site

  • 请点击the new 蔚蓝数据仓库 dataset from Datasets pane from the Power BI 网页site to create a new report

蔚蓝 SQL数据仓库和Power BI 03

  • 展开“ FactInternetSales”
  • 选择“Sales Amount”
  • 展开“ DimProductCategory”
  • 选择“EnglishProductCategoryName”

蔚蓝 SQL数据仓库和Power BI 04

哎呀!看起来很讨厌

请记住,我之前提到过Azure SQL数据仓库可以 不支持主键和外键。因此,Power BI 网页服务无法自动检测任何关系。因此,它对所有产品类别显示相同的销售额。遗憾的是,Power BI网站中没有编辑关系。因此,在此阶段,将Power BI网站直接连接到Azure SQL数据仓库实例可能不是一个好主意。 I posted an idea to add the ability to create or edit relationships in Power BI 网页site。如果您像我一样,并且希望在Power BI的未来版本中看到此功能,请投票支持该想法。 微笑

有一种解决方法,您仍然可以使用直接连接到Azure SQL数据仓库的Power BI 网页服务。您可以在Azure端创建SQL视图,并在视图顶部创建可视化。

时间表刷新

与Azure SQL数据仓库的直接连接使数据集始终保持最新状态。要查看是否确实如此,请执行以下简单步骤:

  • 单击数据集右侧的打开菜单省略号按钮
  • 如你看到的it says “此数据集通过直接连接始终连接到源。您不必计划对此数据集进行刷新。”  因此,我们无需执行任何操作,因为数据集始终是最新的。此数据集通过始终保持最新状态的直接连接连接到源。您不必计划对此数据集进行刷新。

蔚蓝 SQL数据仓库和Power BI 05

我将一些数据插入FactInternetSales,数据集立即得到更新。真的很棒,不是吗?

让我们继续,看看Azure SQL数据仓库如何与Power BI Desktop一起使用。

蔚蓝 SQL数据仓库和Power BI桌面

  • 打开Power BI桌面
  • 单击“ Microsoft 蔚蓝数据仓库”,然后单击“连接”

蔚蓝 SQL数据仓库和Power BI 06

蔚蓝 SQL数据仓库和Power BI 07

  • 单击“数据库”,然后输入您的Azure SQL数据仓库的用户名和密码,然后单击“连接”

蔚蓝 SQL数据仓库和Power BI 08

  • 展开数据库,然后全选,然后单击“加载”

蔚蓝 SQL数据仓库和Power BI 09

  • 请点击“Relationships” view and scroll right

蔚蓝 SQL数据仓库和Power BI 10

  • 如您所见,Power BI Desktop自动检测到很多关系。但是,仍然存在一些缺失的关系。例如,在FactInternetSales和DimDate之间未检测到任何关系。但是,我们在现实世界的项目中可能会遇到不同的情况。因此,我留给您在AdventjureWorksDW数据模型中创建缺失的关系,以进行更多实验。
  • 请点击Report view
  • 展开FactInternetSales
  • 刻度线销售金额
  • 展开DimProductCategory
  • 将EnglishProductCategoryName字段拖放到Axis中
  • 展开DimProductSubCategory
  • 将EnglishProductSubCategoryName字段拖放到EnglishProductCategoryName字段正下方的Axis中,以将向下钻取操作添加到报表中

蔚蓝 SQL数据仓库和Power BI 11

我们已在Azure SQL数据仓库之上的Power BI Desktop上成功创建了一个简单的报告。

  • 请点击Publish from the ribbon.
  • 现在在线跳转并登录您的Power BI帐户
  • 查找您刚刚发布的新报告。一切看起来都按预期进行。

蔚蓝 SQL数据仓库和Power BI 12

注意: 您需要具有Power BI Pro帐户才能在Power BI服务中使用Azure SQL数据仓库数据集。

时间表刷新

在这种情况下,我们从Power BI Desktop连接到Azure SQL数据仓库,这意味着该连接不是直接连接。因此,我们需要在Power BI网站上配置“计划刷新”。

  • 单击数据集右侧的打开菜单省略号按钮
  • 请点击“Schedule Refresh”

蔚蓝 SQL数据仓库和Power BI 13

  • 展开“数据源凭证”
  • 请点击“Edit Credentials”
  • 从“身份验证方法”下拉列表中选择“基本”
  • 输入有效的Azure“用户名”和“密码”
  • 请点击“Sign In”

蔚蓝 SQL数据仓库和Power BI 14

  • 展开“计划刷新”
  • 将“保持数据最新”按钮切换为开
  • 进行所需的时间表设置,然后单击“应用”
  • 展开“精选Q&一个问题”。这是Power BI中新增的功能。您在此处输入的内容都可以在Power BI仪表板中使用。

蔚蓝 SQL数据仓库和Power BI 15

创建 a New Dashboard

  • 打开您从Power BI Desktop发布的报告
  • 请点击“Pin Visual”

蔚蓝 SQL数据仓库和Power BI 16

  • 请点击“New Dashboard” from the “Pin to Dashboard” page
  • 输入新仪表盘的名称,然后单击“固定”

蔚蓝 SQL数据仓库和Power BI 17

  • 从“仪表板”窗格中打开新的仪表板
  • 单击“在此仪表板上询问有关数据的问题”
  • 第一个问题是我们之前添加的特色问题

蔚蓝 SQL数据仓库和Power BI 18

  • 单击问题,然后就可以使用饼图了
  • 您可以将其固定在仪表板上

蔚蓝 SQL数据仓库和Power BI 19

  • 在“固定到仪表板”页面上,单击“固定”

蔚蓝 SQL数据仓库和Power BI 20

  • 回到仪表板,您应该看到新的饼图

蔚蓝 SQL数据仓库和Power BI 21

现在我们完成了。

有关Azure SQL数据仓库和Power BI的一些事实

到目前为止,我们已经在Power BI的Azure SQL数据仓库之上创建了一个有用的仪表板。我们可以在Power BI Desktop中进行许多其他数据可视化和报告,并将它们发布到powerbi.com。然后,我们可以在那里创建许多其他仪表板。

但是,真的吗?当我们想做一个现实世界的项目时会发生什么?好的。让我们看一下有关当前版本的Azure SQL数据仓库与当前版本的Power BI的一些现实情况。我知道它是预览版本,但是以下几点对当前版本有效:

  • 如您所见,有一个“在PowerBI中打开”按钮可用于将Azure SQL数据仓库直接连接到Power BI网站。但是,当Power BI网站无法自动检测到关系时,具有这种功能的意义何在?此外,Power BI网站上没有可用的编辑关系功能,因此目前我们无法使用当前可用功能解决此问题。正如我之前指出的,我们可以在Azure方面创建一些视图,但是我认为这是不现实的。我刚听说,在Power BI网站上为Azure SQL数据仓库支持自动检测关系的工作正在进行中,但是,在无法使用之前,我们无法使用Power BI网站,并具有直接连接到Azure SQL数据仓库的好处。当数据集通过直接连接连接到源时,我们无需配置计划刷新,并且Power BI端的数据集将始终是最新的。

图片

  • 如前所述,Power BI Desktop可以自动检测Azure SQL数据仓库的关系。但是,它有多精确?当我们连接到Adventure Works示例时,我们看到Power BI Desktop检测到一些关系。但是,我发现了创建新关系或编辑现有关系时遇到的一些问题。请尝试以下示例:
      1. 您可能会注意到,在FactInternetSales和DimDate之间没有检测到任何关系。尝试使用FactInternetSales中的OrderDateKey和DimDate中的DateKey定义关系。 图片 如您所见,该关系是无效的。如果您想激活关系,您将收到以下消息:两个表之间已经存在活动关系。您可以停用现有关系,然后将其激活。” 实际上,这绝对可以。我们都知道Power BI模型不支持两个表之间的多个关系。但是,问题是要弄清楚我们首先需要停用哪种关系会很痛苦。正如我所说 我以前的帖子之一 我们可以使用USERELATIONSHIP函数来控制关系,但是,如果要为每个关系编写DAX代码,则将非常耗时。
      2. 在FactSalesQuota和DimDate之间检测到一种关系。停用关系。 Power BI桌面编辑关系现在尝试再次激活它,看看会发生什么。 Power BI桌面编辑关系01 糟糕!您不可以这样做!让我们尝试另一个。停用FactInternetSales与DimProduct之间的关系。 Power BI桌面编辑关系02 现在尝试激活它,销售事情发生了。Power BI桌面编辑关系03
  • 更新:我注意到Q&A不适用于Azure SQL数据仓库直接连接。因此,当您创建新的信息中心时,&A is NOT there.

功率Q&A

因此,尽管我相信Azure SQL数据仓库和Power BI的结合将在不久的将来为企业级项目提供完美的解决方案,但我认为当前版本还不够成熟,无法支持基于Web的真实数据可视化项目企业级分布式数据库。

希望收到您的意见和建议。

5 thoughts on “蔚蓝 SQL数据仓库和Power BI

  1. 嗨,Soheil!我正在尝试整合我们的供应商之一’的报告,这样我就可以向管理人员提供他们正在寻找的详细信息,并且一直在尝试自学Power BI和数据库基础知识。现在我们的一个供应商已经发布了API,而我’我想知道如何最好地将其与Power BI集成。我浏览了您的网站,想知道您是否有几分钟的时间聊天或回答一些问题。如果没有,那也可以,我感谢您已经发布的知识!

    谢谢!

    艾丽莎·赖特(Alissa Wright)

    1. 嗨艾丽莎,

      欢迎访问biinsight.com。
      从网站API加载数据’转换为Power BI模型,打开Power BI Desktop,然后单击“Web” from “Get Data”.
      加载数据后,您可以轻松创建所需的报告和仪表板。
      I’如有需要,我们很乐意与您联系,因此我给您发送了一封电子邮件。
      如果需要,您可以回复我,以进行更详细的讨论。

      干杯

  2. 嗨Sobheil,

    强大的Power BI详细分析&Azure SQL DW。您是否知道我们是否可以在这种情况下应用行级安全性?

有什么想法吗?在这里与我们分享:

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.