Shark数据仓库系统
Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。
要求:
-
Scala 2.10.3
-
AMPLab's Hive 0.11
-
Spark 0.9.x
评论
Apache Tajo分布式数据仓库系统
Tajo是一个分布式数据仓库系统,基于Hadoop实现,特点是低延迟、高可伸缩,提供专用查询和ETL工具特点:可伸缩性和低延迟完全分布式的SQL查询处理,基于存储雨HDFS的大数据集超低响应时间(约1
Apache Tajo分布式数据仓库系统
0
InfobrightMySQL数据仓库解决方案
Infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/groupby之类),下面是Infobright的架构图:
InfobrightMySQL数据仓库解决方案
0