DataFusion基于 Rust 的查询执行框架

联合创作 · 2023-10-01 00:04

DataFusion 是一个可扩展的查询执行框架，用 Rust 编写，使用 Apache Arrow 作为其内存格式。

DataFusion 支持用于构建逻辑查询计划的 SQL 和 DataFrame API，以及能够使用线程对分区数据源（CSV 和 Parquet）并行执行的查询优化器和执行引擎。DataFusion 还通过 Ballista crate 支持分布式查询执行。

特性：

高性能：利用 Rust 和 Arrow 的内存模型，DataFusion 实现了非常高的性能

易于连接：作为 Apache Arrow 生态系统（Arrow、Parquet 和 Flight）的一部分，DataFusion 与大数据生态系统的其余部分配合良好

易于嵌入：几乎可以在其设计的任何一点进行扩展，DataFusion 可以针对特定用例进行定制

高质量：DataFusion 本身以及与 Arrow 生态系统的其余部分都经过广泛测试，可用作生产系统的基础。

示例用法

对存储在 CSV 中的数据运行 SQL 查询：



use datafusion::prelude::*;

use datafusion::arrow::util::pretty::print_batches;

use datafusion::arrow::record_batch::RecordBatch;



#[tokio::main]

async fn main() -> datafusion::error::Result<()> {

  // register the table

  let mut ctx = ExecutionContext::new();

  ctx.register_csv("example", "tests/example.csv", CsvReadOptions::new())?;



  // create a plan to run a SQL query

  let df = ctx.sql("SELECT a, MIN(b) FROM example GROUP BY a LIMIT 100")?;



  // execute and print results

  df.show().await?;

  Ok(())

}

浏览 32

点赞

收藏

分享

举报

评论

图片

表情

Perseus基于 Rust 的 Web 开发框架

Perseus 是一个速度极快的前端 Web 开发框架，采用 Rust 构建，支持在构建时、请求时、

RedisGears基于 Redis 的动态执行框架

RedisGears是一个基于Redis的动态执行框架，使用方法：GearsBuilder().filter(filter_function).map(map_function).groupby(ke

RedisGears基于 Redis 的动态执行框架

RedisGears 是一个基于 Redis 的动态执行框架，使用方法：GearsBuilder()

Perseus基于 Rust 的 Web 开发框架

Perseus是一个速度极快的前端Web开发框架，采用Rust构建，支持在构建时、请求时、增量时或任何你想要的方式生成页面状态。支持静态生成（只提供静态资源）支持服务器端渲染（提供动态资源）支持在一段

swc基于 Rust 的编译器

swc是用Rust所编写的编译器，主要用于编写 TypeScript/JavaScript代码。根据官方说法，swc在单线程上相比同类型的软件 babel快20倍，而在四核基准测试中快70倍。性能：基

Finance Rust基于 Rust 的金融计算库

Finance Rust 是使用 Rust 语言开发的金融计算库，开发过程借鉴了许多金融数学理论与公

swc基于 Rust 的编译器

swc 是用 Rust 所编写的编译器，主要用于编写 TypeScript/ JavaScript

Finance Rust基于 Rust 的金融计算库

FinanceRust是使用Rust语言开发的金融计算库，开发过程借鉴了许多金融数学理论与公式。已经支持的函数： Amortization(AM) CompoundAnnualGrowthRate(C

rust-av基于 rust 的多媒体工具包

rust-av是一个用Rust语言的类型，内存和数据安全属性编写的多媒体工具库。编译cargo build运行测试cargo test说明代码仍然在不断变化，API也正在慢慢充实，请参阅子包装箱。

rust-av基于 rust 的多媒体工具包

rust-av 是一个用 Rust 语言的类型，内存和数据安全属性编写的多媒体工具库。编译cargo

点赞

收藏

分享

举报