业务连续性整理

小脑门

共 3588字,需浏览 8分钟

 · 2021-12-18

一、基本概念

业务连续性(Business Continuity):是指企业有应对风险、自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面:

  1. 高可用(High Availability):它是指提供在本地故障的情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。

  2. 连续操作(Continuity Operations):它是指当所有无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。

  3. 灾难恢复(Disaster Recovery):它是指当灾难破坏生产中心时,在不同地点恢复数据的能力。

业务连续性管理(Business Continuity Management,简称BCM):是一项综合管理流程,它使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标是为了提高企业的风险防范能力,以有效地响应非计划的业务破坏并降低不良影响。

 (华为BCM政策参考图)

二、案例分享

1、巴林银行倒闭事件


巴林银行风险事件的原因分析:无论是巴林银行倒闭,还是日本大和银行和法国兴业银行巨亏事件,表面上看是由于相关交易员的违规操作及投机失误造成的,但究其根本,还是在于银行内部管理制度缺失及外部监管无力低效。

2、从911事件看金融灾备


911事件发生后,金融机构聚集的世贸大厦里的大量数据化为乌有,这是对所有金融机构的重大挑战。德意志银行(Deutsche Bank)早在1993年就制订了严谨可行可信的业务连续性计划(BCP),灾难发生后,德意志银行调动4000多名员工及全球分行的资源,短时间内在距离纽约30公里的地方恢复了业务运行,得到了客户和行业的好评。摩根士丹利(Morgan Stanley)在25层办公场所全毁,3000多员工被迫紧急疏散的情况下,半小时内就在灾备中心建立了第二办公室,第二天就恢复全部业务,可谓金融灾备的典范。与之相反,纽约银行(Bank of New York)在数据中心全毁,通讯线路中断后,缺乏灾备系统和有力的应急业务恢复计划,在一个月后不得不关闭一些分支机构,数月后不得不破产清盘。 

  据统计,金融业在数据系统遭到破坏的2天内所受损失为日营业额的50%,如果两个星期内无法恢复信息系统,75%的公司将业务停顿,43%的公司将再也无法开业,没有实施灾难备份措施的公司60%将在灾难后2—3年间破产。911事件后,全球金融业都认识到金融灾备的必要性和重要性,这是金融业在灾难发生时合理避险、快速恢复、稳定运行的关键。

3、WL之殇

https://www.sohu.com/a/249479914_241731

只有亲身经历才能深有体会,从这件事情上学到很多,致敬曾经的辉煌。

4、元气森林被薅羊毛事件


元气森林被薅羊毛事件最有意思的是和2021年1月1日起施行的《中华人民共和国民法典》关联上了关系,这也意味着一些由于软件生产故障造成的民生影响,已经被拿到台面上来解决了。


5、孟加拉银行黑客攻击事件

虽然该案例并不能算是一个很好的业务连续性案例,但因其足够经典且能体现出应急处理机制(SOP)的水平,特在此记录分析。


详情:https://baijiahao.baidu.com/s?id=1677538177219598248&wfr=spider&for=pc

根据梳理其时间轴,足以证明这是一场有预谋的黑客攻击事件。黑客手段实用,思维缜密,至今仍是悬案。


    从2001年的911事件之后,人们才真正对金融行业的业务连续性投以足够的重视。从而引出了巴塞尔协议III,巴塞尔银行监管委员会发布的《巴塞尔协议Ⅲ》明确指出,操作风险是由于不确定的内部操作流程、人员、系统或外部事件导致的直接或间接损失的风险。由于信息系统软件、硬件、网络、机房环境、通信电力等不确定性因素发生故障,导致业务中断或者出现差错,势必对商业银行的服务、资金、名誉等造成损失。近年来,国际社会、银行家日益关注操作性风险防控和银行体系的稳定,因而建立一套以业务连续性风险控制为核心的风险防控体系,防止运营中断事件发生或者即使发生要能快速应对,是商业银行确保业务连续运营和健康发展的重要途径,也是银行面临的重点和难点。 

  银监会发布的《商业银行业务连续性监管指引》明确要求降低或消除因信息系统服务异常导致重要业务运营中断的影响,快速恢复被中断业务,维护公众信心和银行业正常运营秩序,提高商业银行业务连续性管理能力;要求有效应对重要业务运营中断事件,建设应急响应、恢复机制和管理能力框架,形成保障重要业务持续运营的一整套管理体系,包括策略、组织架构、方法、标准和程序;要求将业务连续性管理纳入全面风险防控体系,建立与本机构战略目标相适应的业务连续性管理体系,确保重要业务在运营中断事件发生后快速恢复,降低或消除因重要业务运营中断造成的影响和损失,保障业务持续运营;要求根据本行业务发展的总体目标、经营规模以及风险控制的基本策略和风险偏好,确定适当的业务连续性管理战略。 

      商业银行积极推进“两地三中心"(同城互备、异地灾备)建设,可以有效应对城区内运营中断事件(建筑物倒塌、社区电力中断、通信设施毁坏等)、区域性运营中断事件(地震、洪灾、战争等)。商业银行对信息系统进行了灾备等级划分,明确了不同等级信息系统灾备要求。大多数商业银行建立了同城灾备环境,保障核心业务数据安全,在运营中断事件发生时确保核心业务快速恢复。

     而通常对风险防控的重要性和价值认识不足,尚未形成有效的风险防控管理体系,对风险防控缺乏必要的理解,特别是高层管理人员认为风险防控管理体系建设“投入大、收益小”。部分商业银行的大部分风险防控参与的人员来自于IT部门,业务连续性计划仅作为运营中断事件处理的应急预案,未建立系统性的风险防控组织体系。


二、本质用途

BCM到底有什么用呢,为什么人们要投入精力去研究它?

    简言之,BCM能够识别出可能带给企业的潜在威胁以及这些威胁发生时对业务运营带来的负面影响,同时也提供了一套有效的反馈和恢复体系,从而对股东利益、公司声誉和价值创造活动进行有效的保护。

三、业务连续性提升

如何提升业务连续性呢?

  • 提高安全生产能力:要想提高业务连续性,首先需要提高安全生产能力,安全生产是业务连续性的一个具现形态,是一个可落地的方案,安全生产 < 业务连续性。安全生产是一个大概念,首先要对员工安全意识宣贯,尤其是对之前没有任何安全生产经验的员工,应该采用洗脑式的宣贯和周期性的反复灌输。没有捷径也不能中断。

  • 明确业务连续性指标


                        (仅供参考:可以根据自身业务寻找最有价值的SLA)

  • 制定提升计划

  • 阶段性提升安全意识

四、个人成就

    搞业务连续性,提高安全生产意识对我们个人有什么好处?这部分能力是我们的以后职业生涯的核心价值体现,是我们视野拔高的一个翘板。是我们从持久的业务需求软件开发跳跃到软件工程的一个契机。


    自1968年,NATO在联邦德国举行的关于软件开发的会议上,首次提出了软件工程的术语,标志着软件工程作为一门学科的正式出现,至今已有40年的历史。其目的是倡导以工程的原理、原则和方法进行软件开发,以解决软件危机。软件工程已经逐渐的回到其本身的位置上。而从今年公布的十四五规划中可以看出,即:软件工程 ≠ 软件开发 ≠ 互联网 ≠ 程序员,而是一个自有学科,是能够上升到国家战略的技术类学科。之前总能听到类似『为什么经典的软件图书都是国外作者写的,国内的人怎么写不出来经典的书籍?』这类问题(国内的大神都在忙着写面试宝典和极客教程呢),其实也很好理解,毕竟软件行业起源于国外,我们一直是在追赶尚未完成超越。不过近些年软件行业发展的越来越好,很多高校培养了大批量的人才投入社会,软件研究生成了各大厂校招的主要角力主体。

五、ISO22301——业务连续性管理体系

    目前,ISO22301业务连续性管理已经引起全球的关注,无论是公共或私有部门的组织都必须了解如何准备和应对意外的破坏性的事故发生。在任何时候事故都能使组织的业务中断,采用ISO22301认证标准最大的好处是将保证组织能够应对事故并保证其业务的持续运行。



详情见:ISO22301http://www.iso27001.org.cn/fuwu/it/iso22301/

  (参考目录)

浏览 493
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报