Arroyo分布式流处理引擎
Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在有效地对数据流执行有状态计算。与传统的批处理不同,流引擎可以在有界和无界源上运行,并在结果可用时立即发出。
使用 SQL 转换、过滤、聚合和连接 Kafka 流,并在亚秒级获得结果。自动从每秒 10 个事件扩展到数百万个事件。
简而言之:Arroyo 让你可以通过亚秒级结果提出大量实时数据的复杂问题。
特性:
- SQL 和 Rust 管道
- 每秒可扩展至数百万个事件
- 有状态操作,如窗口和连接
- 用于管道容错和恢复的状态检查点
- 通过数据流模型进行及时的流处理
一些示例用例包括:
- 检测欺诈和安全事件
- 实时产品和业务分析
- 实时摄取到你的数据仓库或数据湖
- 实时机器学习特征生成
评论