一个有意思的报告:线上故障引发问题原因分布。
转行程序员
共 913字,需浏览 2分钟
· 2021-09-06
今天看了个线上故障原因排行分析,数据采样不是很广,但也不致于不能参考,样本率本身也很难界定,当然越大越准,根据我个人开发经验来看,这个数据还是很符合我日常开发出现问题的规律的。对业务影响度最高的原因主要集中在以下几个方面:

1. 配置数据参数错误:(1.0)属于操作不当,粗心。
2. 代码逻辑错误:(0.74)纯粹的bug,测试没有覆盖到。
3. 架构设计问题:(0.45)开发对系统设计经验不足,个人无法避免,可以通过团队规范(技术评审)来避免,早发现早治疗。
4. 网络故障:(0.4)面对网络抖动问题,看公司基础架构能力了,完善的备用网络,自动切换,以及告警机制,能否及时通知到所有受影响的业务方。
5. 硬件损坏问题:(0.35)开发无能为力,不需要关心,遇到就是倒霉。
6. 其他类别问题:(0.34)诡异问题。
7. 性能不足问题:(0.28)取决于对线上业务量提前评估,运营如果搞活动提前通知技术,突发流量需要看公司基础架构有无自动弹性扩容能力,如果有,开发是否接入且正确配置参数。
8. 遭受攻击导致:(0.09)这个,看公司安全团队了,开发一般也做不了什么。
总结:代码逻辑错误和配置参数错误引发的P0问题最多,主要由初次上线或者变更引起,但是,由于代码逻辑变更及灰度流程相对成熟,配置数据变更影响度最高。这需要配置中心有完善的灰度机制,且需要开发人员严格遵守,这就取决于团队如何约定执行开发规范了,有的靠开会教育,效果不好就靠KPI强制要求,就是谁出问题谁背最低绩效,这个完全看老板风格,不同团队,做的好坏的程度也参差不齐。
通过这个分析,面试时如果被问在工作中遇到的故障,如何发现,如何修复等类似问题,可以按照这个故障原因优先级来归类。
如果你还遇到其他原因,欢迎留言,你都遇到过什么问题?
评论
金融研究 | 使用Python测量关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
我看阿里的年终奖总算发了!
到4月底了,这两天看朋友圈,发现阿里的年终奖终于发了,问了问老同学,也从网上检索了不少信息,基本搞清楚了阿里今年的年终奖情况。近来来阿里一些集团对绩效等级做了较大的调整,以前的旧绩效系统中,绩效分为3.25、3.5、3.75、4和5五个等级,其中4和5是较高绩效等级,较少见。而且之前3.5绩效内部划
公子龙
0
金融研究(更新) | 使用Python构建关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
盘点Lombok的几个骚操作,你绝对没用过!
👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目 2.0 版本完结啦, 演示链接:http://116.62.199.48/ ,新项目正在酝酿中
小哈学Java
0
堪称最优秀的Docker可视化管理工具——Portainer你真的会用吗?
来源:blog.csdn.net/shark_chili3007/article/details/123366179👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目
小哈学Java
0
Apache Paimon毕业,湖仓架构的未来发展趋势!
北京时间 2024 年 4 月 16日,开源软件基金会 Apache Software Foundation(以下简称 ASF)正式宣布 Apache Paimon 毕业成为 Apache 顶级项目(TLP, Top Level Project)。经过社区的共同努力和持续创新,Apache Paim
程序源代码
0
JS的这些新特性,你都用过么?
大厂技术 高级前端 Node进阶点击上方 程序员成长指北,关注公众号回复1,加入高级Node交流群作为一门不断演进的语言,JavaScript每年都会引入新特性。这些特性的加入,能够帮助我们编写更加简洁、高效、易于维护的代码。然而,并非所有新特性
程序员成长指北
1
【深度学习】人人都能看懂的LSTM
熟悉深度学习的朋友知道,LSTM是一种RNN模型,可以方便地处理时间序列数据,在NLP等领域有广泛应用。在看了台大李宏毅教授的深度学习视频后,特别是介绍的第一部分RNN以及LSTM,整个人醍醐灌顶。本文就是对视频的记录加上了一些个人的思考。0. 从RNN说起循环神经网络(Recurrent Neur
机器学习初学者
0