个性化阅读
专注于IT技术分析

Hive和HBase之间有什么区别?

蜂巢:

Hive是构建在Hadoop之上的数据仓库软件包。它主要用于数据分析。它通常针对已经熟悉结构化查询语言(SQL)的用户。它与SQL非常相似, 称为Hive查询语言(HQL)。 Hive管理和查询结构化数据。而且, hive抽象了Hadoop的复杂性。 Hive由Facebook在2007年开发, 用于处理大量数据。它不支持:

  • 不是完整的数据库。
  • 不是实时处理系统。
  • 不符合SQL-92。
  • 不提供行级插入, 更新或删除。
  • 不支持交易和有限的子查询支持。
  • 处于发展阶段的查询优化。

HBase的:

HBase是在Hadoop分布式文件系统(HDFS)之上运行的面向列的数据库管理系统。它非常适合稀疏数据集, 这在许多大数据用例中都很常见。它是由Apache软件基金会开发的开源分布式数据库。最初, 它被命名为Google Big Table, 之后被重命名为HBase, 主要用Java编写。它可以存储从TB到PB的大量数据。它是为低延迟操作而构建的, 并广泛用于读取和写入操作。它以表的形式存储大量数据。

Hive和HBase之间的区别:

蜂巢 HBase的
Hive是一个查询引擎 数据存储, 特别是非结构化数据
主要用于批处理 广泛用于交易处理
不是实时处理 实时处理
仅用于分析查询 实时查询
在Hadoop的顶部运行 在HDFS(Hadoop分布式文件系统)的顶部运行
Apache Hive不是数据库 支持NoSQL数据库
它具有模式模型 它没有架构模型
专为高延迟操作而设计 专为低延迟操作而设计

赞(0)
未经允许不得转载:srcmini » Hive和HBase之间有什么区别?

评论 抢沙发

评论前必须登录!