本文概述
维建模使用多维数据集操作表示数据, 使用OLAP数据管理可以使逻辑数据表示更合适。维度建模的感知是由Ralph Kimball开发的, 它由“事实”和“维度”表组成。
在维建模中, 交易记录分为“事实”(通常是数字交易数据)或“维度”(它们是为事实提供上下文的参考信息)。例如, 销售交易可能会损害事实, 例如订购的产品数量和产品价格, 以及损害尺寸, 例如订购日期, 用户名, 产品编号, 订单运送至和开单地点以及负责接收订单的推销员。
尺寸建模的目标
尺寸建模的目的是:
- 生成易于最终客户理解和编写查询的数据库体系结构。
- 最大限度地提高查询效率。它通过最小化表的数量以及它们之间的关系来实现这些目标。
尺寸建模的优点
以下是维建模的好处:
尺寸建模很简单:尺寸建模方法使仓库设计人员可以创建业务客户可以轻松掌握和理解的数据库架构。无需对如何阅读图表进行大量培训, 并且不同数据元素之间也没有复杂的关系。
维度建模可提高数据质量:星型模式使仓库管理员可以对数据仓库执行参照完整性检查。由于事实信息密钥是其相关维度的要点的串联, 因此, 如果适当描述了相应的维度记录并且该事实记录也存在于数据库中, 则会主动加载事实记录。
通过强制使用外键约束作为参照完整性检查的一种形式, 数据仓库DBA可以增加针对损坏的仓库数据的防护线。
通过聚合可以实现性能优化:随着数据仓库规模的增加, 性能优化已成为紧迫的问题。必须等待几个小时才能对查询做出响应的客户很快就会对仓库不满。聚合是可以优化查询性能的最简单方法之一。
尺寸建模的缺点
- 为了保持事实和维度的完整性, 向数据仓库加载来自各种操作系统的记录非常复杂。
- 如果采用维度技术的组织更改其开展业务的方式, 则修改数据仓库的操作将变得很严重。
尺寸建模要素
事实
它是相关联的数据项的集合, 包括度量和上下文数据。它通常代表业务项目或业务交易。
尺寸图
它是描述一个业务维度的数据的集合。维度决定事实的上下文背景, 它们是执行OLAP的框架。
测量
它是事实的数字属性, 代表业务相对于维度的绩效或行为。
考虑到关系上下文, 在维度建模中使用了两个基本模型:
- 明星模特
- 雪花模型
星形模型是维模型的基础结构。它有一个宽大的中央桌子(事实桌子)和一组较小的桌子(尺寸), 这些桌子以径向设计围绕主桌子排列。雪花模型是分解一个或多个维度的结论。
事实表
事实表用于记录业务中的事实或度量。事实是公司感兴趣的数字数据元素。
事实表的特征
事实表包括我们测量的数值。例如, 事实值为20可能意味着已售出20个小部件。
每个事实表都包括关联维表的键。这些在事实表中称为外键。
事实表通常包括少量列。
与维表比较时, 事实表具有大量行。
尺寸表
维表建立了事实的上下文。维表存储描述事实的字段。
尺寸表的特征
维度表包含有关事实的详细信息。举例来说, 这使业务分析师能够更好地理解数据及其报告。
维度表包括有关事实表中数值的描述性数据。也就是说, 它们包含事实的属性。例如, 用于营销分析功能的维表可能包括时间, 营销区域和产品类型等属性。
由于维表中的记录是非规范化的, 因此它通常具有大量的列。维度表所包含的信息行比事实表少得多。
维度表中的属性用作文档或查询结果显示中的行和列标题。
示例:城市和州可以在事实表中查看商店摘要。可以按品牌, 颜色等查看项目摘要。可以按名称和地址查看客户信息。
事实表
时间ID | 产品编号 | 客户ID | 售出单位 |
---|---|---|---|
4 | 17 | 2 | 1 |
8 | 21 | 3 | 2 |
8 | 4 | 1 | 1 |
在此示例中, 事实表中的“客户ID”列是与维表结合的外键。通过单击链接, 我们可以看到事实表的第2行记录了这样的事实, 即客户3 Gaurav在第8天购买了两个商品。
尺寸表
客户ID | Name | 性别 | 收入 | 教育 | 区域 |
---|---|---|---|---|---|
1 | Rohan | Male | 2 | 3 | 4 |
2 | Sandeep | Male | 3 | 5 | 1 |
3 | Gaurav | Male | 1 | 7 | 3 |
层次结构
层次结构是一棵有向树, 其节点是尺寸属性, 并且其弧模型对尺寸属性组之间的多对一关联进行建模。它包含一个定位在树的根处的维度, 以及定义该维度的所有维度属性。
评论前必须登录!
注册