个性化阅读
专注于IT技术分析

数据仓库入门介绍

本文概述

数据仓库

数据仓库是一种关系数据库管理系统(RDBMS)构造, 可以满足事务处理系统的需求。可以粗略地将其描述为可以查询业务收益的任何集中式数据存储库。它是一个数据库, 用于存储旨在满足决策要求的信息。它是一组决策支持技术, 其目标是使知识工作者(执行人员, 经理和分析师)能够做出更高, 更高的决策。因此, 数据仓库为业务主管提供了支持体系结构和工具, 以系统地组织, 理解和使用其信息来制定战略决策。

数据仓库环境包含提取, 运输和加载(ETL)解决方案, 在线分析处理(OLAP)引擎, 客户分析工具以及其他处理收集信息并将其交付给业务用户的过程的应用程序。

什么是数据仓库?

数据仓库(DW)是一个关系数据库, 旨在进行查询和分析, 而不是事务处理。它包括从单个或多个来源的交易数据中得出的历史数据。

数据仓库提供集成的, 企业范围的历史数据, 并专注于为决策者提供数据建模和分析的支持。

数据仓库是一组特定于整个组织的数据, 而不仅仅是特定的一组用户。

它不用于日常操作和交易处理, 而是用于决策。

可以将数据仓库视为具有以下属性的数据系统:

  • 它是一个数据库, 用于使用来自各种应用程序的数据进行调查任务。
  • 它通过相对较长的交互支持相对较少的客户端。
  • 它包括当前和历史数据, 以提供信息的历史视角。
  • 它的使用是读取密集型的。
  • 它包含一些大表。

“数据仓库是面向主题的, 集成的且随时间变化的信息存储, 以支持管理层的决策。”

数据仓库的特征

数据仓库

面向主题

数据仓库的目标是为决策者建模和分析数据。因此, 数据仓库通常提供围绕特定主题(例如客户, 产品或销售)的简洁明了的视图, 而不是全球组织的持续运营。这是通过排除对主题无用的数据并包括用户理解主题所需的所有数据来完成的。

数据仓库

集成

数据仓库集成了各种异构数据源, 例如RDBMS, 平面文件和在线交易记录。它要求在数据仓库期间执行数据清理和集成, 以确保不同数据源之间命名约定, 属性类型等的一致性。

数据仓库

时间变化

历史信息保存在数据仓库中。例如, 一个人可以从3个月, 6个月, 12个月甚至是来自数据仓库的先前数据中检索文件。交易系统的这些变化通常只保留最新文件。

数据仓库

非挥发性

数据仓库是物理上独立的数据存储, 是从源可操作RDBMS转换而来的。数据仓库中不会发生数据的操作更新, 即不执行更新, 插入和删除操作。在数据访问中通常只需要两个过程:初始加载数据和访问数据。因此, DW不需要事务处理, 恢复和并发功能, 从而可以大大加快数据检索的速度。非易失性定义了一旦输入仓库, 数据就不应更改。

数据仓库

数据仓库的历史

数据仓库的想法出现在1980年代后期, 当时IBM研究人员Barry Devlin和Paul Murphy建立了“业务数据仓库”。

本质上, 计划了数据仓库构想以支持用于从操作系统到决策支持环境的信息流的体系结构模型。该概念试图解决与流程相关的各种问题, 主要是与流程相关的高成本。

在没有数据仓库体系结构的情况下, 需要大量空间来支持多个决策支持环境。在大型公司中, 各种决策支持环境独立运行是很平常的。

数据仓库的目标

  • 帮助报告和分析
  • 维护组织的历史信息
  • 成为决策的基础。

数据仓库需求

出于以下原因, 需要数据仓库:

数据仓库的历史
  1. 1)业务用户:业务用户需要一个数据仓库来查看过去的汇总数据。由于这些人不是技术人员, 因此可以以基本形式将数据提供给他们。
  2. 2)存储历史数据:需要数据仓库来存储过​​去的时间变量数据。将该输入用于各种目的。
  3. 3)制定战略决策:某些战略可能取决于数据仓库中的数据。因此, 数据仓库有助于制定战略决策。
  4. 4)为了保证数据的一致性和质量:将来自不同来源的数据放在一个普通的地方, 用户可以有效地保证数据的一致性和一致性。
  5. 5)高响应时间:数据仓库必须为某些意外负载和查询类型做好准备, 这需要高度的灵活性和快速的响应时间。

数据仓库的好处

  1. 了解业务趋势并做出更好的预测决策。
  2. 数据仓库旨在执行出色的大量数据。
  3. 最终用户可以更轻松地访问数据仓库的结构, 以进行导航, 理解和查询。
  4. 在许多规范化数据库中可能很复杂的查询在数据仓库中更易于构建和维护。
  5. 数据仓库是一种管理大量用户对大量信息的需求的有效方法。
  6. 数据仓库提供了分析大量历史数据的功能。

先决条件

在学习数据仓库之前, 你必须具有基本数据库概念的基础知识, 例如架构, ER模型, 结构化查询语言等。

听众

本教程将帮助计算机科学专业的学生理解与数据仓库相关的基础到高级概念。

问题

我们保证你不会在此数据仓库教程中找到任何问题。但是, 如果有任何错误, 请在联系表格中发布问题。


赞(1)
未经允许不得转载:srcmini » 数据仓库入门介绍

评论 抢沙发

评论前必须登录!