直播|Apache Hudi 0.11.0 新版本新特性解读

架构师精进

共 1409字,需浏览 3分钟

 · 2022-05-15


Apache Hudi 社区在 2022 年 4 月 30 日发布了新版本 0.11.0,其中包括了一系列新功能和提升优化。详情可参考:

https://hudi.apache.org/releases/release-0.11.0/

5 月 11 日,DataFun 将联合 Onehouse 举行线上直播分享,深度解读 Apache Hudi 0.11.0 新版本新特性解。本次交流将围绕以下几个方面进行解读:

  • 多级索引

  • Spark SQL 新功能

  • Flink 集成改进

  • 快速浏览其他功能和提升

01

详细日程


DataFunTalk开源交流会:

Apache Hudi 0.11.0 新版本新特性解读

分享时间

分享内容

分享嘉宾

09:00

多级索引 Multi-Modal Index

Onehouse 软件工程师

郭一骅(Ethan Guo)

09:20

Spark SQL 新功能与 Flink 集成改进

腾讯数据湖研发高级工程师
徐前进

09:40

快速浏览其他功能和提升

Onehouse Team Lead

许世彦

09:50

Q&A



02

详细介绍

1 郭一骅(Ethan Guo) Onehouse 软件工程师
个人简介:Apache Hudi Committer,致力于流式数据处理及湖仓一体架构的设计与实现。Onehouse Software Engineer,构建并优化湖仓一体产品。曾任 Uber Senior Software Engineer,设计并实现移动网络性能监测系统,近实时观测生产环境下 Uber app 移动端在全球的网络性能。
演讲主题:Apache Hudi 0.11.0 新功能简介:多级索引 Multi-Modal Index
演讲提纲:
- 为何在 Apache Hudi 中引入多级索引 Multi-Modal Index
- 多级索引的设计与实现
- 利用多级索引极大提升性能
听众收益:
- Apache Hudi 如何利用多级索引(Multi-Modal Index)极大提升读写性能?
- 怎样利用 Data Skipping 极速提升大宽表的查询性能?
- 异步索引器 Async Indexer 有哪些好处?
2 徐前进 腾讯数据湖研发高级工程师
个人简介:多年大数据工作经验,开源大数据组件 Flink、 Iceberg、Pulsar 等贡献者,Apache Calcite 和 Apache Hudi Committer。目前在腾讯从事数据湖存储相关的开发
分享主题:Spark SQL 新功能与 Flink 集成改进
听众收益:
  • Spark SQL中time travel、call commond的使用场景

  • Flink中HoodieCatalog和Bucket Index详解

3 许世彦 Onehouse Team Lead
个人介绍:Apache Hudi PMC成员及Committer。现就职于Onehouse,在Hudi工程团队担任Team Lead。主要工作包括推动Hudi路线图的演进和执行,开发读写引擎相关功能和平台服务,以及面向企业用户的生产环境构建和优化。曾任Zendesk数据湖团队Team Lead。
分享主题:快速浏览其他功能和提升
听众收益:
  • 对Spark DataSource 查询优化的改进、Schema演进、保存点和状态恢复等其他功能的初步了解。

03

活动报名


浏览 52
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报