Impala的使用

database

用来处理存储在Hadoop集群中大量数据的大规模并行处理的sql查询引擎，它是由C++和Java编写的开源软件，它提供了访问Hadoop中分布式文件系统中的数据的最快的方法。

1.使用Impala，与其他SQL引擎（如Hive）相比，用户可以使用SQL查询以更快的方式与HDFS或HBase进行通信。

2.Impala将相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue Beeswax）用作Apache Hive，为面向批量或实时查询提供熟悉且统一的平台。

3.减少了使用MapReduce的延迟，这使Impala比Apache Hive快。

虽然Cloudera Impala使用与Hive相同的查询语言，元数据和用户界面，但在某些方面它与Hive和HBase不同。下表介绍了HBase，Hive和Impala之间的比较分析。

一、

HBase是基于Apache Hadoop的宽列存储数据库。它使用BigTable的概念。

Hive是一个数据仓库软件。使用它，我们可以访问和管理基于Hadoop的大型分布式数据集。

Impala是一个管理，分析存储在Hadoop上的数据的工具。

二、

HBase的数据模型是宽列存储。

Hive遵循关系模型。

Impala遵循关系模型。

三、

HBase是使用Java语言开发的。

Hive是使用Java语言开发的。

Impala是使用C ++开发的。

四、

HBase的数据模型是无模式的。

Hive的数据模型是基于模式的。

Impala的数据模型是基于模式的。

五、

HBase提供Java，RESTful和Thrift API。

Hive提供JDBC，ODBC，Thrift API。

Impala提供JDBC和ODBC API。

六、

HBase支持C，C＃，C ++，Groovy，Java PHP，Python和Scala等编程语言。

Hive支持C ++，Java，PHP和Python等编程语言。

Impala支持所有支持JDBC / ODBC的语言。

七、

HBase提供对触发器的支持。

Hive不提供任何触发器支持。

Impala不提供对触发器的任何支持。

以上是 Impala的使用的全部内容，来源链接： utcz.com/z/536350.html