SREWorks云原生运维平台
SREWorks 作为阿里云大数据SRE团队对SRE理念的工程实践,专注于以应用为中心的一站式“云原生”、“数智化”运维 SaaS 管理套件,提供企业应用&资源管理及运维开发两大核心能力,帮助企业实现云原生应用&资源的交付运维。
传统IT运维领域已经有大量优秀的开源运维平台,反观云原生场景,目前还缺乏一些体系化的运维解决方案。随着云原生时代大趋势的到来,阿里云大数据 SRE 团队将SREWorks运维平台开源,希望为运维工程师们提供开箱即用的运维平台。
SREWorks 有什么优势?
回归到运维领域的需求,无论上层产品和业务形态怎么变化,运维本质上解决的还是“质量、成本、效率、安全”相关需求。SREWorks 用一个运维 SaaS 应用界面来支撑上述需求,同时以“数智”思想为内核驱动 SaaS 能力,具体包括交付、监测、管理、控制、运营、服务六部分。
快速安装
本文会将 SREWorks 以最小化的方式安装在 Kubernetes 上,这样可以帮助你节省资源。
前提条件
- Kubernetes 的版本需要大于等于 1.20
- 硬件:
- 分布式部署: 建议至少3台节点(配置为4 核 CPU,16G 内存),存储需要300G以上空间,90个Pod以上配额
- 单机完整(数智版)部署: 建议至少 8核/32G内存/300G硬盘
- 单机基础版部署: 建议至少 4核/16G内存/100G硬盘
安装部署
推荐使用 Helm 来安装 SREWorks
安装 Helm
使用以下命令安装(如果已安装了 Helm 3,可以跳过这一步骤):
# 适用Mac intel芯片
wget "http://sreworks.oss-cn-beijing.aliyuncs.com/bin/helm-darwin-amd64" -O helm
# 适用Linux intel芯片
# wget https://sreworks.oss-cn-beijing.aliyuncs.com/bin/helm-linux-am64 -O helm
chmod +x ./helm
mv ./helm /usr/local/bin/
网络模式: Ingress/NodePort
Ingress模式
- SREWorks的部署必须指定ingress的域名。
- 以阿里云ACK集群为例,域名可以在【基本信息】中可以找到,例如
http://*.ceea604.cn-huhehaote.alicontainer.com
,* 部分用户可以自行填写,比如http://sreworks.c34a60e3c93854680b590b0d5a190310a.cn-zhangjiakou.alicontainer.com
。 - 未使用阿里云ACK集群的也可以自行确定浏览器访问SREWorks控制台的域名,在安装时传入
appmanager.home.url
参数即可。
Ingress网络模式部署参数参考如下
--set appmanager.home.url="https://your-website.***.com"
NodePort模式
- 在云厂商购买虚机,运行NodePort模式需要注意被访问节点(NODE_IP)的网络安全组或防火墙,打开该端口(30767)的公网被访问限制。
NodePort网络模式部署参数参考如下
--set global.accessMode="nodePort"
--set appmanager.home.url="http://NODE_IP:30767"
部署版本: 基础版/数智版
基础应用包含8个应用: 运维中台/应用管理/团队管理/集群管理/模板中心/帮助中心/文件管理/系统设置 数智应用包含7个应用: 数据运维平台/智能运维平台/故障自愈/健康管理/运营中心/作业调度平台/运维搜索
基础版SREWorks在单台4核16G机器上即可正常启动,基础版部署为基础应用,默认完整部署为 基础应用 + 数智应用。
基础版部署参数参考如下
--set saas.onlyBase=true
3. 验证安装
在浏览器中输入上个步骤的域名,如果能够看到页面,说明已经安装完成(大约需等待5分钟左右)。注册并开始使用 SREWorks。默认账号为admin
,默认密码为12345678
4. 卸载
helm uninstall sreworks -nsreworks
kubectl delete namespace sreworks