OMP智能运维管理平台

联合创作 · 2023-09-27 02:38

OMP(Operation Management Platform)是云智慧公司自主设计、研发的轻量级、聚合型、智能运维管理平台。是一款为用户提供便捷运维能力和业务管理的综合平台。具备运维一应俱全的功能,目的是提升运维自动化、智能化,提高运维效率,提升业务连续性和安全性。

OMP设计初衷

目前运维面临的痛点:

  • 主机环境多样性,难以统一管理:如:混合云、私有云、跨IDC、虚拟化、容器化等
  • 业务变更难度较大,自动编排能力较低
  • 业务状态监控,多平台难以数据联动
  • 业务出现异常,难以实现故障自愈
  • 业务运行状态,难以评估,更难以分析
  • 运维知识匮乏,缺少专家指导及专家解决方案

运维管理平台(OMP)的设计初衷就是想打造一应俱全的运维平台,降低交付难度,提升运维自动化、智能化,提高运维效率,提升业务连续性和安全性。

OMP核心功能

  • 主机纳管:纳管主机资源,实时监控主机运行状态,可在线管理、在线连接终端等
  • 应用管理:平台已内置常用基础组件,也支持符合标准的自研服务发布到应用商店,从而提供便捷的应用管理,如:安装部署、变更发布、弹性扩缩容、在线配置、优化等
  • 应用监控:涵盖标准监控、定制监控、链路监控、智能监控等多种业务场景,通过大数据智能测算,可感知未来趋势,将异常控制在发生前
  • 故障自愈:当业务系统出现异常或故障时,可按照预定的自愈策略进行故障治理,极大降低故障对业务影响,减少企业损失
  • 状态巡检:自动、手动进行业务指标、运行状态汇总,支持自动发送报告到指定邮箱
  • 备份/恢复:针对核心数据进行本地+异地备份,支持自动执行备份并将数据发送至指定邮箱,达到异地的存储效果,确保数据安全
  • 精简工具:提供运维常用工具、命令、脚本、SQL等,为日常运维操作提供便利,减少误操作、减低技术门槛,支持自行维护、扩充更多工具
  • 知识文库:积累运维常用知识、技术、架构、解决方案等,支持自行维护、扩充文库内容
  • 小智解答:可以快速检索知识文库内容,如文库知识不足,可以申请人工远程支持
  • 权限管理:针对不同用户、角色,进行权限控制,及操作审计
  • 大屏展示:用大屏来展示最核心的运营状态
  • 批量处理、流水线:<待定>

架构设计

img.png

环境依赖

后端技术栈:

  • Python 3.8.7
  • Django 3.1.4
  • Saltstack 3002.2
  • Uwsgi 2.0.19.1

前端技术栈:

  • Tengine 2.3.2
  • React 17.0.1

监控技术栈:

  • Prometheus 2.25.1
  • Alertmanager 0.21.0
  • Grafana 7.4.3
  • Loki 2.1.0
  • Promtail 2.2.0

Web 访问

通过浏览器访问页面,访问入口为:http://omp.cloudwise.com/#/login
默认用户名:admin
默认密码:Common@123
每晚 00:00 将重置数据

浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报