YTsaurusYandex 开源大数据平台

联合创作 · 2023-09-18 19:46

YTsaurus 是一个分布式存储和处理大数据的平台,支持 MapReduce 模型,带有一个分布式文件系统和一个 NoSQL 键值数据库。



平台优势:



  • 多租户生态

    • 一套相互关联的子系统:MapReduce、SQL 查询引擎、job 调度、用于 OLTP 工作负载的键值存储。

    • 支持大量用户,消除多次安装并简化硬件使用


  • 可靠性和稳定性

    • 没有单点故障

    • 服务器之间的自动复制

    • 更新时不损失计算进度


  • 可扩展性

    • 多达 100 万个 CPU 内核和数千个 GPU

    • 不同介质上的 EB 级数据:HDD、SSD、NVME、RAM

    • 数万个节点

    • 自动服务器扩展和缩减


  • 丰富的功能

    • 扩展 MapReduce 模块

    • 分布式 ACID 事务

    • 各种 SDK 和 API

    • 计算资源和存储的安全隔离

    • 用户友好且易于使用的用户界面


  • 由 ClickHouse 提供技术支持的 CHYT

    • 众所周知的 SQL dialect 和熟悉的功能

    • 快速分析查询

    • 通过 JDBC 和 ODBC 与流行的 BI 解决方案集成


  • 由 Apache Spark 提供支持的 SPYT

    • 一组用于编写 ETL 过程的流行工具

    • 启动并支持多个迷你 SPYT 集群

    • 轻松迁移现成的解决方案



 

浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报