Impala 2.12.0 发布,高性能分布式 SQL 引擎

Impala 2.12.0 发布,目前未见相关更新信息,您可以关注 更新主页 获取更新信息。

Impala 是一个高性能分布式 SQL 引擎,是用于处理存储在 Hadoop 集群中的大量数据的 MPP(大规模并行处理)SQL 查询引擎。用 C ++和 Java 编写而成,与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。

Impala 通过使用标准组件(如HDFS,HBase,Metastore,YARN和Sentry)将传统分析数据库的SQL支持和多用户性能与Apache Hadoop的可扩展性和灵活性相结合。

  • 使用Impala,与其他SQL引擎(如Hive)相比,用户可以使用SQL查询以更快的方式与HDFS或HBase进行通信。

  • Impala可以读取Hadoop使用的几乎所有文件格式,如Parquet,Avro,RCFile。

Impala 将相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)用作Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。

与Apache Hive不同,Impala不基于MapReduce算法。 它实现了一个基于守护进程的分布式架构,它负责在同一台机器上运行的查询执行的所有方面。

因此,它减少了使用MapReduce的延迟,这使Impala比Apache Hive快。

点击下载

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章