本文概述
- 1. PowerBI概述
- 2.使用Power BI的优势
- 3. Power BI桌面
- 4.入门
- 5.转换数据
- 6.报告
- 7.仪表板
- 8. Power BI与R&Python的集成
- 9.保存和发布
- 10.结论
我们作为数据分析师的目标是以各种方式安排我们的数据见解, 使每个看到它们的人都能够理解其含义并据此采取行动。
Power BI是Microsoft提供的基于云的业务分析服务, 可让任何人以更快的速度和效率可视化和分析数据。它是用于连接和分析各种数据的功能强大且灵活的工具。许多企业甚至认为它对于与数据科学相关的工作必不可少。 Power BI的易用性来自它具有拖放界面的事实。此功能有助于轻松, 快速地执行诸如排序, 比较和分析之类的任务。 Power BI还与多种来源兼容, 包括Excel, SQL Server和基于云的数据存储库, 这使其成为数据科学家的绝佳选择。
本教程将涵盖以下主题:
- Power BI概述
- 使用Power BI的优势
- PowerBI桌面
- 入门
- 转换资料
- 报告制作
- 建立仪表板
- Power BI与R&Python的集成
- 保存和发布
- 总结
1. PowerBI概述
总览
Power BI使你能够在本地以及在云中分析和探索数据。 Power BI提供了在同事和组织之间轻松, 安全地协作和共享自定义仪表板和交互式报告的功能。
资源
Power BI的组件
Power BI由各种组件组成, 这些组件可以在市场上单独购买, 也可以单独使用。
内容来源
选择使用哪个组件主要取决于项目或团队。但是, 我们将使用Power BI桌面, 因为这是主要用于业务报告生成和桌面创建的组件。另外, 所有其他工作通常从Power BI桌面开始, 在该桌面上创建报告。
2.使用Power BI的优势
Power BI具有某些优势, 使其优于现有的分析工具:
- 提供基于云以及桌面的界面。
- 提供诸如数据仓库, 数据发现和交互式仪表板之类的功能。
- 能够加载自定义可视化文件, 以及
- 在整个组织中轻松扩展。
3. Power BI桌面
Power BI是一个免费的应用程序, 可以下载并安装在系统上。它可以连接到多个数据源。通常, 分析工作在Power BI Desktop中开始, 在该处创建报告。然后将报告发布到Power BI服务, 从那里可以将其共享到Power BI Mobile应用程序, 以便人们甚至可以在移动设备上查看报告。
来源:https://docs.microsoft.com/zh-cn/learn/modules/get-started-with-power-bi/2-using-power-bi
安装
Power BI仅在Windows计算机上运行。 Mac用户可以在Azure中启动Windows VM并将Power BI加载到其中, 或使用Turbo.net, Turbo.net可以将Power BI直接从云流传输到Mac。
Power BI可以通过两种方式使用:
- 作为Microsoft商店中的应用程序, 只需登录即可开始使用。这是该工具的在线版本。
- 在本地下载软件, 然后安装。确保阅读所有安装说明。
根据产品的选择, 将软件下载到计算机上。接受许可协议后, 通过单击Power BI图标/应用程序验证安装。如果出现以下屏幕, 则表示一切正常。
4.入门
现在让我们对使用Power BI Desktop有所了解。在本节中, 我们将对其进行一些探索以使其习惯于它的界面。
Power BI工作区
下图突出显示了Power BI工作区的主要组成部分。
基本观点
- 报告视图:这是创建仪表板的主视图。
- 数据视图:数据视图提供了整个数据的预览。
- 关系视图:关系视图显示各种对象之间的关系。
连接到数据源
Power BI可以连接到多个数据源。 “获取数据”图标显示所有可能的可用选项, 可从中将数据导入Power BI。
让我们看一些最常用的数据源:
- Excel数据
让我们连接到Excel数据源。该工作簿包含一些虚假的财务数据。从这里下载文件。 Power BI Desktop将加载工作簿并读取其内容, 并使用”导航器”窗口向你显示文件中的数据。
加载后, 可以在”字段”窗格中查看数据。
- 网页
你也可以使用网络上的数据。这是一个数据集, 显示了美国退休的最佳和最差状态。
链接:http://www.bankrate.com/finance/retirement/best-places-retire-how-state-ranks.aspx
只需选择” Web”作为”获取数据”中的选项, 然后输入URL的名称。
也尝试使用其他数据源。
5.转换数据
数据加载后, 在”字段”选项卡下将可见。在这里, 我们可以借助查询编辑器修改数据集。查询编辑器可用于修改数据集, 而不考虑其数据源。我们可以在查询编辑器中进行诸如重命名数据集, 删除单个或多个列等操作。单击主页功能区上的”编辑查询”按钮可以访问查询编辑器。
创建一个自定义列
使用与上面相同的财务数据, 让我们调整数据以满足需求。让我们创建一个名为”新制造价格”的自定义列, 该列等于:
([manufacturing Price])*3
更改列数据类型
列的数据类型也可以轻松更改。 “已售单位”列的浮点数据类型可以调整为整数。
移除列
卸下色谱柱也很容易。只需选择要选择的列, 然后选择”删除列”选项, 如下图所示。让我们摆脱”折扣”列, 因为它没有为我们的数据集增加任何价值。
同样, 还有许多其他功能可以执行, 例如删除和添加行, 转置, 旋转和拆分, 这些功能可以通过查询编辑器轻松实现。请注意, 你要转换数据的所有步骤也会显示在”查询设置”面板中。
6.报告
报告是可以在一个或多个页面上创建的可视化的集合。这些可视化通常相互关联。
7.仪表板
仪表板是多个视图的集合, 使一个视图可以同时比较各种数据。报告可以包含多个页面, 而仪表板是一个页面界面。
创建仪表板
一旦完成所有操作的数据集准备就绪, 就可以继续进行仪表板创建过程。 Power BI仪表板(也称为画布)在一个页面上包含许多可视化内容, 有助于讲述一个故事。这些称为磁贴的可视化文件从报告固定到仪表板。
现在, 让我们尝试了解使用超级市场数据集可以获得哪些见解:
- 国家销售
- 分部销售额和利润
- 月销售额和利润
- 按产品销售
- 折扣带利润
创建的仪表板是交互式的, 这意味着一个磁贴中的更改会影响另一个。
8. Power BI与R&Python的集成
除了Power BI提供的各种可视化优势外, 它还具有惊人的即开即用连接功能。 Power BI可以轻松地与Python, R等语言集成, 甚至可以与SQL等DBMS集成。这在功能方面提供了更多优势, 对于习惯于使用Python或R的数据科学家来说非常方便。他们可以将R和Python脚本直接导入工作区中, 并利用其可视化效果, 而可视化效果远胜于此。这些语言。
在本节中, 我们将学习如何在R中使用Python和R脚本。要了解有关SQL与Power BI集成的信息, 这里有一篇详细的文章:
- 带有Power BI的SQL
Power BI和R
R是一种流行的统计语言, 用于执行复杂的分析和预测分析, 例如线性和非线性建模, 统计测试, 时间序列分析, 分类, 聚类等。将Power BI与R结合使用可使用户访问丰富的, 不断扩展的统计分析和数据挖掘库的收集, 以帮助他们从数据中获得更深刻的见解。
先决条件
确保在本地系统上安装并正在运行以下产品:
- [R
- 像R Studio这样的单独的R集成开发环境(IDE)。
同样重要的是要注意:
- 仅导入数据帧
- 任何运行30分钟以上的R脚本都会自动超时。
确认系统上已安装R和R studio。启动Power BI并转到”选项和设置->选项”
在选项下, 转到R脚本选项卡, 并确保你可以看到正确的R版本。
在Power BI中使用R脚本
在Power BI中使用R脚本是有关此主题的绝佳资源。以下是来自同一来源的概述。
- 用于导入数据的R脚本
有时候, 你可能不想导入整个数据集, 而只是其中一部分。你可以编写R脚本, 以仅从整个数据集中选择要加载到Power BI中的特定列或行。
对于此演示, 我们将使用CRAN发行版中包含的众所周知的Iris数据集。
数据集也可以从文件中导入。这是一个示例, 显示了如何使用以下脚本将CSV文件加载到工作区中。从这里下载文件。
iris_csv <- read.csv(file="C:/Users/Parul/Desktop/Iris", header=TRUE, sep=", ")
仅使用R脚本导入数据并没有什么用。实际用途是在导入时可以操纵数据的时间。以下脚本使用dplyr R软件包中提供的summary和group_by函数对数据进行分组和聚合, 然后再进行导入:
启动R Studio并安装以下软件包:
install.packages("dplyr")
install.packages("data.table")
install.packages("ggplot2")
现在, 使用以下R脚本导入虹膜数据。我们将获得一个名为iris_mean的新数据集, 其中包含四个度量值的平均值, 并根据”种类”列中的值进行了分组(来源:Power BI简介)。
library(dplyr)
iris_mean <- summarize(group_by(iris, Species), slength = mean(Sepal.Length), swidth = mean(Sepal.Width), plength = mean(Petal.Length), pwidth = mean(Petal.Width))
2.用于转换数据的R脚本
当我们要处理已经导入到工作空间中的数据时, R脚本会派上用场。假设我们要在导入全部数据后应用摘要和分组依据功能。这可以通过在查询编辑器中运行R脚本来实现, 如下所示:
3.用于创建可视化效果的R脚本
借助R脚本, 你可以在Power BI中创建可视化。只需键入脚本并加载必要的库, 即可获得类似于任何R IDE中的可视化效果。让我们完成以下步骤:
- 将虹膜数据集导入到工作区中。
- 在可视化选项卡中单击” R脚本可视”, 占位符R可视图像出现在画布上, 脚本编辑器位于底部。
- 选择要包含在脚本中的字段。我们选择PetalLengthCm, PetalWidthCm和Species。所选字段显示在”值”选项卡下, 而预填充的R脚本显示在R编辑器中。
- 该脚本使用选定的列创建一个名为dataset的数据框。现在, 你可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入ggplot库并创建散点图。
library(ggplot2)
ggplot(data=dataset, aes(x=PetalWidthCm, y=PetalLengthCm)) +
geom_point(aes(color=Species), size=2) +
ggtitle("Petal Widths and Lengths") +
labs(x="Petal Width", y="Petal Length") +
theme_bw() +
theme(title=element_text(size=15, color="blue3"))
PowerBI和Python
Python是一种广泛使用的通用编程语言, 并且大量Python库可用于使用机器学习算法执行统计分析和预测建模。
微软最近使在PowerBI中集成Python脚本成为可能, 该脚本可在Power BI中运行Python脚本并获得Python视觉效果。让我们看看执行此操作所需的步骤。但在此之前, 有一些先决条件:
- 确保Python已在本地系统上启动并运行。
- 还应加载所有必需的软件包和库, 例如pandas, matplotlib等。
- 当前, 仅支持熊猫数据框。
- 任何运行30分钟以上的Python脚本都会自动超时。
- 必须先启用Python, 然后才能使用它。启动Power BI并转到”选项和设置->选项”
在”选项”下, 转到”预览功能”标签并启用” Python支持”。
重新启动Power BI, 你将在可视化以及”转换”选项卡中都获得Python图标。
在Power BI中有多种运行Python脚本的方法。
- 专门运行Python脚本
脚步:
- 要运行Python脚本, 请选择”获取数据”>”更多”>”其他”>” Python脚本”, 如下所示。
现在, 只需将你的Python脚本粘贴到打开的窗口中即可。选择确定以运行脚本, 然后将生成的数据集导入Power BI Desktop工作区。
2.使用Python创建可视化
- 将数据集导入工作空间。使用相同的财务数据集, 该数据集与假设公司的财务信息有关。
- 单击可视化选项卡中的” Python视觉效果”, 占位符Python视觉图像出现在画布上, 而Python脚本编辑器位于底部。
- 选择要包含在脚本中的字段。我们选择”销售和利润”。所选字段出现在”值”选项卡下, 脚本也出现在Python脚本编辑器中。
- 该脚本使用选定的列创建一个名为dataset的熊猫数据框。你现在可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入matplotlib并创建一个绘图。
导入matplotlib.pyplot作为plt数据集.plot()plt.title(“销售与利润”)plt.show() - 运行脚本, 可视化效果出现在画布上。可视化效果与在任何Python IDLE中一样。
- 接下来, 让我们创建一个相关图。除了前面的字段之外, 选择”折扣”, “销售总额”和”售出的单位”, 然后用以下新脚本替换脚本:
导入matplotlib.pyplot作为plt plt.matshow(dataset.corr(‘pearson’))plt.show()
我们还可以导入其他库。让我们导入Seaborn库, 但要确保它已安装在系统上。该数据集称为”提示”数据集, 通常会预先加载seaborn。从此处下载数据集并将其加载到工作空间中。然后将下面的代码粘贴到脚本编辑器中, 你将获得最原始的图。
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid")
sns.relplot(x="total_bill", y="tip", data=dataset)
sns.relplot(x="total_bill", y="tip", hue="smoker", data=dataset);
sns.relplot(x="total_bill", y="tip", hue="smoker", col="time", data=dataset);
plt.show()
具有所有Python可视化效果的仪表板最终将像这样显示。
Python资讯主页
9.保存和发布
保存和导出文件
你可以将文件另存为Power BI模板。可视化效果也可以导出为PDF文件。
出版
数据仅在可以在人员或组织之间共享时才有用。也可以通过将生成的仪表板或报告发布到Power BI服务来共享它们。然后, 我们可以使用Power BI Apps来查看仪表板/报表或与之交互。
10.结论
这就是我们在PowerBI中创建良好的可视化所需的全部知识, 尽管在每个阶段进行的修改可能要比我们在这里做的要多得多。因此, 通过实验和实践, Power BI变得更加熟悉, 并将释放出惊人的功能来帮助我们分析和呈现数据。
参考文献:
- https://docs.microsoft.com/en-us/power-bi/desktop-what-is-desktop
评论前必须登录!
注册