本文概述
我认为你知道数据对公司各个级别的重要资产, 无论他或她是执行官还是董事, 数据都起着关键作用。但是拥有大量数据并不会使公司成功, 除非他们从中获取有价值的信息。
这些信息将直接或间接影响收入。为了从大型数据补丁中获取信息, 需要使用Google Analytics(分析)平台, 幸运的是, 我们市场上存在许多产品, 可满足组织在描述性, 诊断性和预测性报告方面的问题。
从数据的角度来看, 数据的成熟度确实很重要, 其成熟度级别可以通过以下方面进行分类:
- 与当前架构一致的数据
- 企业工具
- 没有多个重叠的来源
- 基于云的架构或本地数据仓库
- 数据标准和专家
- 预测分析及其确定的用例
- 将数据视为金融资产并将其与AI集成
数据的成熟度将从上到下依次增加组织中的上述几点。
数据成熟度将与技术, 体系结构, 组织和数据策略齐头并进。
- 所谓技术, 是指组织将如何利用它所购买的技术。
- 架构将这些技术整合在一起, 以便数据轻松地围绕它们移动。
- 通过组织, 我将讨论与数据交互的人员。
- 数据策略的改进:数据管理的各个方面对于任何组织的高性能都是至关重要的。所采用的数据管理实践将为分析数据所需的分析人员提供相关的结构化数据, 并减少数据准备时间。这将有助于高级管理人员通过数据可视化以及易于理解的数据表示形式来实现提高盈利能力, 更高的ROI的目标。这还将帮助组织改进数据性能并优化存储。
好了, 这就是我们现在谈论数据的全部内容, 而我们谈论的是Google Analytics(分析)平台。我们知道市场上有众多的分析平台, 几乎不可能涵盖所有平台, 这就是为什么我要选择四个市场领先的大公司:
- 在讨论视觉分析时, Tableau提出了黄金标准。它的变体是Tableau Desktop, Prep, Online和Server。每个功能都可以将自助服务BI扩展到不同的级别。 Tableau桌面提供了具有自助服务见解的最佳可视化分析和商业智能平台之一。 Tableau Prep可让更多人在一起, 以更快地分析数据。 Tableau Online在没有实际服务器的情况下扩展了共享和协作。 Tableau Server与可以在本地或云中的实际服务器共享数据。有关在Tableau中开发仪表板的详细信息, 请访问此处。
- SAP SAP是企业工具市场中的一个著名名称, 它为具有多种配置文件的公司提供解决方案。 SAP已经推出了多种Google Analytics(分析)产品;它自己的业务仓库系统以更加平滑的方式提供了与Enterprise的集成, 并可以处理大量数据。它的最新版本是SAP Analytics cloud和SAP Lumira, 之前收购了Business Objects并将其作为自己的分析平台提供。
- Tibco Spotfire Tibco Spotfire是一款以非常专业且受过良好教育的方式满足高级分析和预测分析的产品之一。与其他产品的Predictive Analytics实例相比, 它非常强大。 Tibco提供本地和云服务。它还提供了预配置的可扩展体系结构, 而对IT维护的关注很少。
- Qlik以快速创建指导性分析应用程序而闻名, 该应用程序支持用户驱动的数据探查到最低数据层次。它拥有自己的存储库和内存处理功能。它确实有两个变体QlikView和QlikSense。 QlikView是用于个人和企业版的BI应用程序构建工具。 QlikSense是可集成到云中的BI的端到端应用程序服务。
如你所知, 上述所有平台都是不同的, 并且具有各自的功能。因此, 我将对以下四个主要参数进行比较分析:
- 数据采集
- 资料准备
- 可视化
- 预测建模
数据获取参数涉及数据导入, 数据提取, 数据连接和数据访问。可以简单地说, 它具有从不同来源或语义服务(例如SQL, Bigdata, Cloud Services)获取数据的能力。
现在, 我们比较一下它们拥有的数据采集功能上的工具:
画画
当我们谈论Tableau时, 如果你过去曾经使用过Tableau, 你还将瞥见令人印象深刻的可视化效果, 这些可视化效果是通过即时甚至复杂的数据探索创建的。
Tableau没有自己的数据存储库, 它从不同的来源获取数据并将其转换为有意义且易于理解的可视化文件。
因此, 它应该具有连接到不同源的连接器, 而且还好。 Tableau具有100多种不同的数据源连接性, 还提供与事务数据的实时连接。
在数据采集参数中, 它确实占了上风。
的SAP
SAP拥有多种产品来支持数据采集, 这些产品将充当中间层, 以向最终可视化提供数据。但是谈到Lumira和Analytics(分析), 目前它确实支持到60多个数据源的连接, 而毫无疑问, 随着时间的推移, 连接将增加。
SAP从其生态系统中获取数据没有任何问题, 实际上, 从其自身的生态系统中获取数据将是最轻松的工作。当我们谈论从不同的生态系统获取数据时, 它确实拥有有助于移动数据的工具, 但同时也增加了额外的工作和技能。
Tibco Spotfire
Spotfire是功能最强大, 有时甚至是最复杂的工具之一, 在获取数据时, 它确实具有40多个数据源连接器, 并且始终可以通过JDBC和ODBC连接器解决问题。它确实支持可有效提供数据的Bigdata和云连接器。
当需要在数据采集之前进行数据清理时, 会出现数据采集问题。
Qlik
Qlik是BI中不断增长的市场领导者之一。在获取数据时, Qlik确实有大量的数据源连接器分为不同的组。 Qlik拥有自己的存储库, 用于获取数据和执行ETL(提取, 转换和加载)。在现实生活中, 这解决了很多问题。 Qlik的数据处理技能有助于简化数据的呈现过程。
采集数据之后, 便进行准备步骤。这是没人愿意做的肮脏的工作, 但是无论如何你都不能跳过它。它包括合并数据, 清理, 建模到一个级别, 在此级别上, 我们可以通过简单的选择查询就数据创建描述性报告。
画画
Tableau确实拥有大量的数据准备技术, 可以将数据转换为可报告的报表。你可以在本教程的第二部分和第三部分中找到所有详细信息。
的SAP
SAP再次拥有不同的工具来准备数据。它确实具有功能强大的BW系统, 可以在可能的程度上处理数据。随着HANA的到来, 它在使用内存引擎处理大数据方面获得了巨大的力量。
但这是具有不同技能的独立工具。你可以访问此处以了解SAP的BI方面。
Tibco Spotfire
Spotfire的数据整理功能非常出色, 并且具有模型自动化功能, 可帮助你轻松进行增量数据准备过程, 并减少IT干扰。
所谓增量数据准备, 是指捕获来自不同来源的数据变化并基于该变化准备数据。请访问这里以查看详细信息。
Qlik
Qlik确实具有类似于Tableau的数据准备功能以及其内存引擎。可以根据需求编写单独的脚本, 并在不同的级别上实现。如果你可以一窥有助于转换数据的脚本, 请访问此处。
现在我们至少可以享受我最有趣的部分。我们获取了数据并进行了准备, 但要分析大量数据, 我们需要可视化以节省大量时间并以更快的方式解决问题。数据探索的很大一部分是在可视化中完成的, 其余的则使用统计方法进行。现在查看工具如何在此参数上执行。
画画
Tableau拥有最多种数据可视化组件之一, 这些组件是基于比较, 基于分布, 基于组合, 地图等的。它拥有几乎所有组件, 并因其支持社区而享誉全球。
它也有一些独特的想法, 以及对学习过程的帮助。人们甚至可以在其庞大的画廊中找到所需的图表甚至自定义想法。请访问以查看一些出色的图表和故事。
Tableau是经过IBCS(国际商务通信标准)认证的工具之一, 可用于使用数据可视化最佳实践来改善商务沟通。
的SAP
SAP Lumira是SAP武库中可视化方面使用最广泛的工具。它确实涵盖了所有基本图表要求以及有助于根据要求进行修改的扩展。
SAP Analytics cloud最近获得了IBCS认证, 希望能够继续满足可视化的所有要求。
Tibco Spotfire
Spotfire提供了涵盖所有图表组的所有必要图表功能, 用于以可视格式分析数据。其先进的分析功能允许添加统计分析图以及科学格式。
Qlik
当涵盖几乎所有图表组的图表功能都出现时, Qlik表现良好。它提供了用于修改和添加需求的扩展。
通过点击功能可以访问每个数据点, 并将其与其他工具分开。
现在, 让我们进入所有分析平台所涉及的部分, 尝试将机器学习功能纳入其工具中。很少有人在其中取得成功, 而其他人则对初学者有所帮助。
让我们看看我们从这个参数中得到了多少。
画画
在谈论预测分析方面时, Tableau开始在这一领域开展工作。基本的预测功能已添加到表格中。
除了基本功能之外, 它还可以与R和Python集成在一起, 其详细信息将在本教程的最后部分中介绍。
的SAP
SAP再次提供了与其工具库不同的工具, 以提供用于预测分析的平台。该工具涵盖了基本的预测建模, 并具有良好的时间序列分析功能。当要添加自定义脚本时, SAP primary与R一起使用, 该脚本需要在平台开发的模型中添加。
有关平台的详细信息, 请访问此处。
Tibco Spotfire
Spotfire在预测分析方面处于领先地位, 其将数据科学体系结构适应自身的方法非常明显。
技能要求以及对技术的理解和实施的知识。它结合了数据科学和统计学的方法论, 以产生可以执行预测分析并获得适当投资回报的工具。
要了解更多信息, 请访问。
Qlik
Qlik还致力于将预测分析实施到合理的水平。它在系统中几乎没有实现基本的建模算法, 但是使用它的技能差距仍在不断扩大。尽管它与R和python的集成工作相当令人赞赏。它允许与R和python之类的第三方工具进行数据交换, 并使用其关联引擎来快速高效地进行数据传输。
它还在GitHub上具有开源分析连接, 可与R和python集成。
因此, 这全都是我自己, 这取决于个人或组织, 哪个参数对选择平台最重要。
如果你想了解有关Python, R或SQL的更多信息, 请参加srcmini的入门课程。
- 数据科学Python简介
- R介绍
- SQL for Data Science简介
评论前必须登录!
注册