个性化阅读
专注于IT技术分析

精品!数据仓库面试题和答案合集

下面列出了常见的数据仓库面试问题和答案。

1)什么是数据仓库?

数据仓库是从组织内广泛的来源收集的大量数据, 用于指导业务决策。

点击这里查看更多信息


2)什么是尺寸表?

维表包括保存在事实表中的度量文本属性。维度表是一组层次结构, 类别和逻辑, 可用于客户在层次结构节点中遍历。


3)什么是事实表?

事实表包括业务流程的度量。事实表包括维表的外键。

示例:如果我们在业务阶段是”造纸”, “通过一种设备正常生产纸”或”每周生产纸”将被视为对业务流程的衡量。


4)加载维表有哪些不同的方法?

有两种不同的方法可以在维表中加载数据:

  • 常规(慢速):在对所有约束和键进行验证之前, 先对信息进行验证, 然后将其加载, 并保持此方法的数据完整性。
  • 直接(快速):在加载信息之前, 将禁用所有约束和键。加载信息后, 将针对所有约束和密钥对其进行验证。如果发现数据无效, 则该数据将不包含在索引中, 并且此数据中将跳过所有以后的过程。

5)在事实表和维表中描述外键列?

维度表的外键是实体表的主键。

事实表的外键是维表的主键。


6)什么是数据挖掘?

数据挖掘是从多个角度分析数据并将其汇总为有用数据的阶段。


7)什么是商业智能?

商业智能定义了用于收集, 集成, 分析和演示业务数据(有时是数据本身)的技术, 功能和系统。商业智能的目的是提供更好的商业决策。因此, BI也被定义为决策支持系统(DSS)。


8)什么是OLTP?

OLTP代表在线交易处理。该系统的功能是修改实例接收到的数据并具有大量并发用户。


9)什么是OLAP?

OLAP代表在线分析处理。该系统具有收集, 管理, 处理和呈现多维数据以进行分析和管理过程的功能。


10)OLTP和OLAP有什么区别?

Basic OLTP OLAP
OLTP代表在线交易处理。 OLAP代表在线分析处理。
操作数据是数据的初始数据源。 合并数据来自不同来源。
执行基本业务任务的业务流程快照 计划和决策业务事件的多维视图
客户运行简单快速的查询。 通过计划来更新聚合数据的复杂的长期运行查询。
标准化小型数据库。由于数据库较小, 因此速度不会成为问题, 并且规范化不会降低性能。这采用了实体关系(ER)模型和面向功能的数据库设计。 对大型数据库进行非规范化。由于数据库较大, 因此速度是一个问题, 由于执行任务时要扫描的表较少, 因此取消规范化可以提高性能。这采用面向主题的数据库设计的星型, 雪花型或事实星座模式。
定期的数据库备份和系统管理可以完成这项工作。 重新加载OLTP数据被视为很好的备份选项。

点击这里查看更多信息


11)什么是ODS?

ODS代表运营数据存储。一种数据库体系结构, 是近乎实时的操作记录而不是长期趋势数据的存储库。 ODS可能进一步成为企业共享的操作数据库, 从而允许重新设计操作功能以将ODS用作操作数据库。

点击这里查看更多信息


12)什么是ETL?

ETL代表提取, 转换和加载过程。 ETL是一种软件, 它使企业可以在将记录从一个地方移到另一个地方的同时开发他们的不同记录, 而数据是多种形式或格式并不重要。数据可以来自任何来源。 ETL足够强大, 可以管理此类数据差异。

首先, 提取功能从特定的源数据库读取数据并提取所需的数据子集。

其次, 转换功能使用规则或查找表对获取的记录进行处理, 或者与其他记录创建组合以将其转换为所需状态。

最后, 使用加载功能将结果信息写入目标数据库。

点击这里查看更多信息


13)什么是VLDB?

VLDB代表超大型数据库。一个1 TB的数据库通常被视为VLDB。通常, 存在为大量用户提供服务的决策支持应用程序或事务处理应用程序。


14)什么是实时数据仓库?

数据仓库捕获业务事件数据。实时数据仓库可以捕获发生的业务事件数据。一旦业务事件完成并且有关于它的数据, 完成的事件数据就会流入数据仓库并立即变得可行。


15)什么是一致尺寸?

一致的维度使用它们连接到的每个可能的事实表定义了完全相同的事物。它们对多维数据集很简单。


16)什么是非可加事实?

非累加事实是无法检查事实表中存在的任何维度的事实。它们不会被视为无用的。如果尺寸发生变化, 则相同的事实可能会有用。


17)什么是星型图?

星型模式是一种组织表的方式, 以便我们可以在仓库环境中立即从数据库中获取结果。

点击这里查看更多信息


18)什么是雪花模式?

具有扩展维的任何维都称为雪花模式, 该维可能是相互链接的, 或者可能与其他表有太多的关系。此架构已规范化, 在复杂的联接和非常复杂的查询以及较慢的结果中会得到结果。

点击这里查看更多信息


19)什么是代理密钥?

代理键是基本主键的替代。它只是可用于表主键的每一行的唯一标识符或统计信息。代理主键的唯一要求是它对于表中的每一行都是唯一的。这很有用, 因为基本主键可以更改, 这使更新更加困难。代理键始终是整数或数字。


20)什么是垃圾尺寸?

多个非常小的维度可能会集合在一起以形成一个单一的维度, 而垃圾维度则是与属性不紧密相关的。在维度中对随机标志和文本属性进行分组并将其更改为单独的子维度称为垃圾维度。


21)什么是尺寸建模?

维度数据模型概念包含两种类型的表, 它不同于第三种范式。此概念使用事实表, 其中包括业务度量和维表, 维表包括维的上下文(计算的维数)。

点击这里查看更多信息


22)什么是BUS模式?

BUS模式是从已确认大小的主套件和事实的标准描述中收集的。


23)什么是主动数据仓库?

活跃的数据仓库提供的数据使组织内的决策者能够有效主动地处理客户关系。


24)数据仓库和商业智能之间有什么区别?

数据仓库处理所有管理数据仓库或数据集市的开发, 实施和应用的方法, 包括元数据管理, 数据获取, 数据清理, 数据转换, 存储管理, 数据分发, 数据归档, 操作文档, 分析文档, 安全性管理, 备份/恢复计划等

商业智能是一套软件工具, 可让组织分析其业务的可衡量方法, 例如销售业绩, 盈利能力, 运营效率, 营销活动的有效性, 某些用户群体的市场渗透率, 成本趋势, 异常和例外情况, 等。商务智能用于包含OLAP, 数据可视化, 数据挖掘和查询文档工具。


25)多维OLAP或关系OLAP中哪一个更快?

多维OLAP(MOLAP)比关系OLAP(ROLAP)更快。

  • MOLAP:在这里, 数据保存在多维数据集中。该存储不在关系数据库中, 而是在专有计划中(例如PowerOLAP的.olp文件)。 MOLAP产品与Excel兼容, 可以使记录交互易于学习。
  • ROLAP:ROLAP产品通过使用SQL(结构化查询语言)来处理关系数据库, SQL是用于描述和操纵RDBMS中数据的标准语言。随后的处理可能在RDBMS或中间层服务器中进行, 该服务器接受来自用户的请求, 将其转换为SQL语句, 然后将其传递给RDBMS。

工作/人力资源面试问题
JavaScript面试问题
Java OOP面试问题
JSP面试问题
休眠面试问题
SQL面试题
Android面试题
MySQL面试问题

含义

数据源

工艺目标

查询和流程脚本

数据库设计

备份和系统管理

面试技巧

公司面试问题与程序

Java基础面试问题

Servlet面试问题

春季面试问题

PL / SQL面试问题

Oracle面试问题

jQuery面试问题

赞(0)
未经允许不得转载:srcmini » 精品!数据仓库面试题和答案合集

评论 抢沙发

评论前必须登录!