Arroyo分布式流处理引擎

联合创作 · 2023-09-30 21:05

Arroyo 是一个用 Rust 编写的分布式流处理引擎,旨在有效地对数据流执行有状态计算。与传统的批处理不同,流引擎可以在有界和无界源上运行,并在结果可用时立即发出。

使用 SQL 转换、过滤、聚合和连接 Kafka 流,并在亚秒级获得结果。自动从每秒 10 个事件扩展到数百万个事件。

简而言之:Arroyo 让你可以通过亚秒级结果提出大量实时数据的复杂问题。

特性:

  • SQL 和 Rust 管道
  • 每秒可扩展至数百万个事件
  • 有状态操作,如窗口和连接
  • 用于管道容错和恢复的状态检查点
  • 通过数据流模型进行及时的流处理

一些示例用例包括:

  • 检测欺诈和安全事件
  • 实时产品和业务分析
  • 实时摄取到你的数据仓库或数据湖
  • 实时机器学习特征生成
浏览 8
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报