YTsaurusYandex 开源大数据平台
YTsaurus 是一个分布式存储和处理大数据的平台,支持 MapReduce 模型,带有一个分布式文件系统和一个 NoSQL 键值数据库。
平台优势:
- 多租户生态
- 一套相互关联的子系统:MapReduce、SQL 查询引擎、job 调度、用于 OLTP 工作负载的键值存储。
- 支持大量用户,消除多次安装并简化硬件使用
- 可靠性和稳定性
- 没有单点故障
- 服务器之间的自动复制
- 更新时不损失计算进度
- 可扩展性
- 多达 100 万个 CPU 内核和数千个 GPU
- 不同介质上的 EB 级数据:HDD、SSD、NVME、RAM
- 数万个节点
- 自动服务器扩展和缩减
- 丰富的功能
- 扩展 MapReduce 模块
- 分布式 ACID 事务
- 各种 SDK 和 API
- 计算资源和存储的安全隔离
- 用户友好且易于使用的用户界面
- 由 ClickHouse 提供技术支持的 CHYT
- 众所周知的 SQL dialect 和熟悉的功能
- 快速分析查询
- 通过 JDBC 和 ODBC 与流行的 BI 解决方案集成
- 由 Apache Spark 提供支持的 SPYT
- 一组用于编写 ETL 过程的流行工具
- 启动并支持多个迷你 SPYT 集群
- 轻松迁移现成的解决方案
评论