Tigon分布式流处理框架
Tigon 是一个开源的、实时的、低延迟、高吞吐量的流处理框架。基于 Apache Hadoop 和 Apache HBase 构建。Tigon 严重依赖开源项目 Tephra 和 Apache Twill 提供紧密的集成到已有的 Hadoop/HBase 集群中。
Tigon 应用 这就是“流”,在逻辑上表示为有向无环图(Directed Acyclic Graph),每个节点代表一个处理单元,这些处理单元就是 Flowlet,使用队列来处理单元之间的数据流。
Flows 对于 Tigon 而言相当于 Twill 对于 YARN 容器。提供了运行时弹性的可伸缩性。
Flowlets 可以存储在 HBase ,如果需要可使用 Tephra 的 ACID 属性。
TigonSQL 是 Tigon 附带的一个内存中的流处理库。可利用它来攫取大量的数据流到 Hadoop/HBase 集群中,并执行类 CEP 的查询语句,使用类似 SQL 的语言进行查询。
Tigon 支持不同运行时和环境,你可以运行在单一计算机或者是分布式 Hadoop 集群中,提供直观的命令行接口帮助用户管理 Tigon 流。
要使用 Tigon 必须有:
-
JDK 6 or JDK 7 (用来运行 Tigon)
-
GCC
-
G++
-
Apache Maven 3.0+ (用来构建示例程序)
评论
Apache Samza分布式流处理框架
Samza是近日由LinkedIn开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop,而且使用了Linked
Apache Samza分布式流处理框架
0
Pyleus分布式处理框架
Pyleus是一个来自Yelp的开源框架,使得Yelp的另外一个开源项目mrjob可以运行在ApacheStorm框架上,就像Hadoop一样。开发者可以使用纯Python实现大数据的处理,并进行快速
Pyleus分布式处理框架
0
Arroyo分布式流处理引擎
Arroyo 是一个用Rust编写的分布式流处理引擎,旨在有效地对数据流执行有状态计算。与传统的批处理不同,流引擎可以在有界和无界源上运行,并在结果可用时立即发出。使用SQL转换、过滤、聚合和连接Ka
Arroyo分布式流处理引擎
0