本文概述
星计划
- 在星型模式中, 事实表将位于中心并连接到维度表。
- 这些表完全处于非规范化结构中。
- 由于涉及的连接数量较少, 因此SQL查询性能良好。
- 数据冗余度高, 并占用更多磁盘空间。
雪花模式
- 雪花模式是星形模式的扩展, 其中维表连接到一个或多个维。
- 这些表在结构上部分非规范化。
- 与星型模式相比, SQL查询的性能要低一些, 因为涉及更多的联接。
- 与星型架构相比, 数据冗余度低, 并且占用的磁盘空间更少。
让我们看一下Star模式和Snowflake模式之间的区别。
比较基础 | 星计划 | 雪花模式 |
---|---|---|
易于维护/更改 | 它具有冗余数据, 因此不太容易维护/更改 | 无冗余, 因此更易于维护和更改 |
使用方便 | 不太复杂的查询, 易于理解 | 更复杂的查询, 因此不太容易理解 |
父表 | 在星型模式中, 维度表将没有任何父表 | 在雪花模式中, 一个维度表将具有一个或多个父表 |
查询效果 | 较少的外键数量, 因此减少了查询执行时间 | 更多外键, 从而增加查询执行时间 |
Normalization | 它具有非规范化表 | 它具有标准化表 |
数据仓库类型 | Good for data marts with simple relationships (one to one or one to many) | Good to use for data warehouse core to simplify complex relationships (many to many) |
Joins | 更少的人加入更高 | 联接数 |
Dimension Table | 每个维度仅包含一个维度表 | 每个维度可能有多个维度表 |
Hierarchies | 维的层次结构以星型模式存储在维表本身中 | 在雪花模式中, 层次结构分为多个单独的表。这些层次结构有助于从最上层层次结构到最下层层次结构下的信息钻取。 |
何时使用 | 当维度表包含较少的行数时, 我们可以采用Star模式。 | 当维度表使用冗余信息存储大量行并且存在空间问题时, 我们可以选择雪花模式来存储空间。 |
数据仓库系统 | 在任何数据仓库/数据集市中均能最佳工作 | 更适合小型数据仓库/数据集市。 |
评论前必须登录!
注册