Apache Gravitino 开源统一元数据服务

联合创作 · 2025-03-05 18:01

Apache Gravitino 是一个高性能、地理分布、联合的元数据湖,它直接管理不同来源、类型和地区的元数据,为用户提供数据和 AI 资产的统一元数据访问。

Gravitino 旨在提供几个关键功能:

  • 统一的元数据管理:Gravitino 提供统一的模型和 API 来管理不同类型的元数据,包括关系(例如 Hive、MySQL)和基于文件(例如 HDFS、S3)的元数据源。
  • 端到端数据治理:Gravitino 提供统一的治理层,用于管理元数据,具有访问控制、审计和发现等功能。
  • 直接元数据管理:Gravitino 通过连接器直接连接到元数据源,确保更改立即反映在 Gravitino 和底层系统之间。
  • 地理分布支持:Gravitino 支持跨多个区域或云部署,允许实例共享元数据以实现跨区域全局视图。
  • 多引擎支持:Gravitino 支持查询引擎,无需修改 SQL 方言即可访问元数据。
  • AI 资产管理(WIP):Gravitino 正在扩展以管理数据和 AI 资产,并支持目前正在开发的 AI 模型和功能。

浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报