Apache KuduHadoop 数据存储系统
Apache Kudu 简介
为了应对先前发现的这些趋势,有两种不同的方式:持续更新现有的Hadoop工具或者重新设计开发一个新的组件。其目标是:
对数据扫描(scan)和随机访问(random access)同时具有高性能,简化用户复杂的混合架构;
高CPU效率,最大化先进处理器的效能;
高IO性能,充分利用先进永久存储介质;
支持数据的原地更新,避免额外的数据处理、数据移动
我们为了实现这些目标,首先在现有的开源项目上实现原型,但是最终我们得出结论:需要从架构层作出重大改变。而这些改变足以让我们重新开发一个全新的数据存储系统。于是3年前开始开发,直到如今我们终于可以分享多年来的努力成果:Kudu,一个新的数据存储系统。
评论