微服务时代下,如何通过 APM 实现高效运维?

DevOps技术栈

共 2432字,需浏览 5分钟

 · 2021-04-02

微服务框架落地后,各服务间的调用关系越来越复杂,分布式部署架构带来的问题就会迅速凸显出来。
尤其线上出现问题,不知道如何排查,问题出现在哪个服务?如何快速定位问题?如何跟踪业务调用链路?
于是分布式系统的 APM 管理系统应运而生。APM 系统可以帮助理解系统行为、用于分析性能问题的工具(工具组合),以便发生故障的时候,能够快速定位和解决问题。
相比传统的查日志等方式,它最大的不同就是提效,让参与产品建设的每一个开发者都具备定位全局的能力。
尤其在这个微服务时代,对一线开发和业务负责人都非常重要:
  • 一线开发:每每定期值班时,不可避免会遇到性能定位、故障修复问题。具备 APM 技能可以让你排查性能问题的能力发生质的飞跃。

  • 业务负责人:每个业务线负责人都想保障基本服务没有问题,一旦出了问题能快速解决问题。那让团队学习 APM 再合适不过了,APM 不仅仅有各个维度的指标,便于检测线上服务的运行状况;更能在问题发生时,具备全链路追踪和线上“Debug”剖析问题的能力。

可是,APM 并不是个可以立刻上手的工具,而是个稍有学习门槛的系统。
如果只部署,不演练,团队整体都忽视对 APM 系统的学习,APM 就会逐渐成为耗费进程性能的摆设。
那么应该如何破局,掌握好 APM 这一高效工具呢?其实非常简单,主要有以下三个要点:
  • 找到最短、最高效的学习路径。直接从原理、实践角度学习最主流、好用的 APM 工具,而不要去“啃”官方使用文档和解析源码。

  • 不止步“会用”,更要让工具“好用”。你可以通过了解 APM 协议、数据,以及关键模块落地实战,解决 APM 落地业务时的“水土不服”问题。

  • 工具之外,业务之内。通过学会使用、改造 APM 工具了解其背后的性能定位、分布式链路追踪技能。

但是即使有了方法,没有领路人提供资源和道具,学习之旅也很难进行下去。
所以,我想为你推荐我的一位朋友,他叫赵禹光,是贝壳找房 APM 架构师,SkyWalking PMC,他的专栏「应用性能分析实战」在拉勾教育上线了,现在仅需 1 块钱即可订阅(原价¥98),但是仅限一周,订阅后可以永久收看,感兴趣就快快扫码拿下吧。

这个专栏会怎么讲?

该专栏意在交付给你一套通用的 APM 方法论,适用于 APM 产品在绝大多数企业的落地,而非仅限于某类业务的某种 APM 产品。
  • 带你逐一了解单个工具的使用,对业内五大 APM 产品有深刻认知(学习路径+落地方法) 。
  • 讲解标准的 APM 系统设计原则,包括产品使用存储数据和协议。 
  • 在对应场景下利用、组合不同的 APM 工具,对问题场景打出“组合拳”,实现 1+1 大于 2 的效应 。
  • 关键模块实战落地,能够根据企业的业务特点,快速挑选出合适的模式,完成关键模块的设计落地。
这个专栏你真的要好好学,内容的价值远超你的想象。

因为是他,所以我要推荐

讲师叫赵禹光,他是贝壳找房 APM 架构师,SkyWalking PMC,他从 0-1 实现了贝壳找房 APM 系统的设计与搭建,支撑着二手房、新房等核心业务线。其线上接入了近万个应用节点,并实现了快速定位、准确定位。
作为 Apache SkyWalking PMC 成员、Alibaba Sentinel Committer,致力各个 APM 的持续迭代与技术传播,曾著有图书《Apache SkyWalking 实战》。

到底讲啥,值得我强烈地推荐?

这个专栏会从产品盘点到 APM 工具的设计思想与设计原则,带你由浅入深掌握工具的使用与落地,然后再进行关键功能落地和 APM 软技能进阶。
Part 1. APM 产品落地实战 
这个部分会讲述各个 APM 领域 TOP 1 的开源产品。无论是现在走在前沿、社区非常强大的,还是企业背书,迭代较慢但存量较大的 APM 工具,都会详解其产品功能、业务特色,及其学习路径和落地方法。让你在线上问题出现时,能选择适当工具剖析问题,定位故障。
Part 2. 不读源码学原理 
学习 APM,解读源码比较浪费时间,它更需要你懂原理和标准,然后横向对比同类的技术实现,有章法地根据自身特点进行落地实践。所以,这个部分将以 SkyWalking 和 Sentinel 核心作者的视角,带你“不读源码学原理”,发掘设计思想的意义,高维度学习源码。 
Part 3. APM 协议与数据精讲 
这个部分会讲解通用的规范化日志标准、跨语言协议标准、监控数据的存储模型标准,及其有代表性的标准实现。学完这个部分,你将能够巧妙结合多个 APM 工具,对问题场景打出“组合拳”,实现 1+1>2 的效应,避免眉毛胡子一把抓的情况。 
Part 4. 关键功能落地
这个部分会从 4 个关键功能进行讲解:采样设计,实现数据的低损耗、高收集;BI 监控,指导应用场景的快速落地;链路训练,让开发者具备分布式问题定位能力;望火楼建设,对故障资产进行持续积累。通过这个部分,你将学习每个APM核心功能,如何在本地更好的落地。
Part 5. APM 软技能提升
硬实力要发挥出来,绝对离不开与之相应的软实力。通过这部分将讲解排查故障时固定套路的“三板斧”招式,让你在排查故障时更有头绪;还将通过几个非典型的监控实例,带你高维思考,彻底参透 OpenTracing;最后,一起展望开放分布式追踪及 APM 的未来,在趋势到来之前做好备战。

以下是课程大纲,一定对你很有帮助

⚠️⚠️⚠️ 最后再次提醒
这个原价98元的专栏,现在仅需1元,就可永久解锁 
(这样良心的专栏,不囤我都替你感到亏)

浏览 62
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报