Arroyo分布式流处理引擎

联合创作 · 2023-09-30 21:05

Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在有效地对数据流执行有状态计算。与传统的批处理不同,流引擎可以在有界和无界源上运行,并在结果可用时立即发出。


使用 SQL 转换、过滤、聚合和连接 Kafka 流,并在亚秒级获得结果。自动从每秒 10 个事件扩展到数百万个事件。


简而言之:Arroyo 让你可以通过亚秒级结果提出大量实时数据的复杂问题。



特性:



  • SQL 和 Rust 管道

  • 每秒可扩展至数百万个事件

  • 有状态操作,如窗口和连接

  • 用于管道容错和恢复的状态检查点

  • 通过数据流模型进行及时的流处理


一些示例用例包括:



  • 检测欺诈和安全事件

  • 实时产品和业务分析

  • 实时摄取到你的数据仓库或数据湖

  • 实时机器学习特征生成

浏览 43
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报