Apache KuduHadoop 数据存储系统

联合创作 · 2023-10-01 04:50

Apache Kudu 简介

为了应对先前发现的这些趋势，有两种不同的方式：持续更新现有的Hadoop工具或者重新设计开发一个新的组件。其目标是：

    对数据扫描(scan)和随机访问(random access)同时具有高性能，简化用户复杂的混合架构；
    高CPU效率，最大化先进处理器的效能；
    高IO性能，充分利用先进永久存储介质；
    支持数据的原地更新，避免额外的数据处理、数据移动

我们为了实现这些目标，首先在现有的开源项目上实现原型，但是最终我们得出结论：需要从架构层作出重大改变。而这些改变足以让我们重新开发一个全新的数据存储系统。于是3年前开始开发，直到如今我们终于可以分享多年来的努力成果：Kudu，一个新的数据存储系统。

浏览 28

点赞

收藏

分享

举报

评论

图片

表情

Apache BlurNoSQL 数据存储系统

Blur是一个NoSQL数据存储系统，基于lucene、hadoop、thrift和Zookeeper构建的，包含一系列的分片的lucene索引，可跨越多个服务器存储。这里有一篇介绍入门的文章。

Apache BlurNoSQL 数据存储系统

Blur 是一个 NoSQL 数据存储系统，基于 lucene、hadoop、thrift 和 Zo

Apache HudiUber 大数据存储系统

Hudi 是 Uber 在 2016 年以“Hoodie”为代号开发，旨在解决 Uber 大数据生态

Apache HudiUber 大数据存储系统

Hudi是Uber在2016年以“Hoodie”为代号开发，旨在解决Uber大数据生态系统中需要插入更新及增量消费原语的摄取管道和ETL管道的低效问题。2019年1月，Uber向Apache孵化器提交

Apache OzoneHadoop 对象存储系统

Ozone是Hadoop的对象存储环境，能将HDFS从文件系统扩展成更加复杂的企业级存储层。Ozone使得HDFS块存储层能够进一步支持非文件性质的系统数据，而HDFS的文件块架构也将能够支持存储键值

Apache OzoneHadoop 对象存储系统

Ozone是Hadoop的对象存储环境，能将HDFS从文件系统扩展成更加复杂的企业级存储层。Ozon

CockroachDB数据存储系统

CockroachDB(蟑螂数据库）是一个可伸缩的、支持地理位置处理、支持事务处理的数据存储系统。CockroachDB提供两种不同的的事务特性，包括快照隔离（snapshotisolation，简称

Druid-IOOLAP 数据存储系统

Druid 是一个开源的专为事件数据的 OLAP 查询设计的数据存储系统。Druid 用于大数据实时

Crate数据存储系统

CrateData是一个开源的大规模的可伸缩的数据存储系统，无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过SQL进行检索。易于安装和使用，支持高可用

Crate数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统，无需任何系统管理需求。提供强大的搜索

点赞

收藏

分享

举报