Cloudera Impala基于Hadoop的实时查询
Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。
Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax),这样在使用CDH产品时,批处理和实时查询的平台是统一的。目前支持的文件格式是文本文件和SequenceFiles(可以压缩为Snappy、GZIP和BZIP,前者性能最好)。其他格式如Avro, RCFile, LZO文本和Doug Cutting的Trevni将在正式版中支持。
评论
RHadoop基于 R 语言的 Hadoop
RHadoop是由RevolutionAnalytics发起的一个开源项目,它可以将统计语言R 与 Hadoop 结合起来。目前该项目包括三个Rpackages,分别为支持用R来编写MapReduce
RHadoop基于 R 语言的 Hadoop
0
Apache Drill加快Hadoop查询
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会发起了一项名为“Drill”的开源项目。ApacheDrill实现了Google'sDremel.ApacheDri
Apache Drill加快Hadoop查询
0
Cloudbreak基于 Hadoop 的 Docker service API
用于在云中配置和管理ApacheHadoop集群的工具。作为Hortonworks数据平台的一部分,Cloudbreak使在云基础架构上轻松配置、配置和弹性增长HDP集群变得容易。Cloudbreak
Cloudbreak基于 Hadoop 的 Docker service API
0
Cloudbreak基于 Hadoop 的 Docker service API
用于在云中配置和管理 Apache Hadoop 集群的工具。作为 Hortonworks 数据平台
Cloudbreak基于 Hadoop 的 Docker service API
0