2023年11月1日,新加坡金融管理局(MAS)已暂停星展银行的非必要IT更新六个月,确保该银行始终专注于恢复其数字银行服务的弹性。在此期间,星展银行将不被允许收购新的业务企业或缩小其在新加坡的营业网点和ATM网络的规模。
事件过程
2023年10月14日下午,星展银行和花旗银行的IT系统宕机,直到次日凌晨才完全恢复相关服务。根据新加坡MAS公布的数据,在2023年10月14日14点54分至2023年10月15日4时47分期间,多达81万次对两家银行的数字银行平台访问请求失败;大约有250万笔支付和自动柜员机交易无法完成。
  • 事故发生:10月14日14时54分,数据中心冷却系统故障,机房温度过高,两家银行的IT系统宕机
  • 应急响应:宕机事件发生后,两家银行迅速启动了IT灾难恢复和业务连续性计划
  • 技术问题:恢复过程中,星展银行网络配置错误,花旗银行遇到连接问题,导致无法在备份数据中心完全恢复系统
  • 服务恢复:10月15日4时47分,两家银行相关服务完全恢复
值得注意的是,星展银行在近8个月里已经出现了5次信息技术系统故障事件,分别是2023年3月29日、5月5日、9月26日、10月14日和10月20日。
处罚方案
首先,新加坡MAS对两家银行进行追责。根据MAS对银行业务连续性、IT基础设施弹性以及涉及关键IT系统的外包服务的要求:
  1. 银行需要制定IT灾难恢复计划并定期对其进行测试;
  2. 银行需要定期和备份数据中心进行灾难恢复练习,验证关键系统和服务是否可以在服务中断后4小时内恢复;
  3. 在任意连续的12个月内,影响银行运营或客户服务等关键系统的宕机时间总时长不得超过4小时。
MAS有权对违反技术风险管理要求和2022年通过的金融服务和市场法(Financial Services and Markets Act)的金融机构处以最高100万美元的罚款。
其次,新加坡MAS还可能对两家金融机构采取增加监管资本要求和暂停特定业务展业的处罚。额外的监管资本会对金融机构的信用评级和运营成本产生负面影响:
  1. 星展银行在2010年就因数字银行服务中断问题被新加坡MAS处以1.2倍运营风险加权资产的处罚,相当于增加约2.3亿新元的监管资本;
  2. 2021年11月23日至25日,星展银行再次出现数字银行服务连续中断问题,且暴露出服务恢复计划的事件管理和恢复程序有缺陷,导致故障时间延长,2022年2月,新加坡MAS就该事件要求星展银行立即采取措施提高其现有IT系统的弹性和可恢复性,包括加强系统监控、进行更全面的测试和配置额外的系统冗余,以尽量减少对客户的服务中断,并对其处以1.5倍运营风险加权资产的处罚,相当于增加约9.3亿新元的监管资本;
  3. 此次星展银行连续发生5次系统中断的情况,新加坡MAS采取更加严格的监管处罚措施,对其处以1.8倍运营风险加权资产的处罚,相当于增加约16亿新元的监管资本。
再次,新加坡MAS要求两家银行采取进一步的补救措施,要求对10月14日宕机事件的根本原因进行彻底调查,减少未来可能发生的宕机事件,增强宕机事件发生后的恢复能力。对于星展银行来说,新加坡MAS称其此次连续服务中断的情况是“不可接受”的。因为早在2023年5月时,新加坡MAS就要求星展银行对3月和5月发生的宕机事件进行调查,星展银行为此聘用了埃森哲作为第三方独立顾问,对IT系统灾难恢复计划进行审查,并向新加坡MAS提交了技术弹性路线图,结果随后却又连续发生三次宕机事件,这使得新加坡MAS决定要求星展银行在六个月内不得进行任何非必要的IT更改或收购任何新的业务,使其加强将所有技术资源和精力集中在技术风险管理系统和控制上。另一方面,数据中心作为关键基础设施之一,不仅承载了两家银行的关键信息技术系统,也承载了其他核心机构的信息技术系统,因此,新加坡MAS正在讨论如何进一步加强数据中心的安全和弹性,避免此类事件产生更严重的后果。
最后,新加坡MAS认为没有万无一失的信息技术系统,因此,当宕机事件发生时,金融机构迅速、正确的相应措施能够有效降低宕机事件对客户产生的影响。因此,新加坡MAS可能会要求金融机构更加积极主动地公开和透明向受影响客户更新服务恢复和服务替换的状态。
分析
在监管机构多次要求加强信息技术系统灾难应对能力的情况下,星展银行依然连续发生宕机事件,即使是成立了专项工作小组、聘请第三方独立机构进行调查,也没有明显提高信息技术系统的稳定性,这确实是“不可接受”的,也足以说明星展银行内部在信息技术系统管理上存在严重缺陷。
对于经营机构来说,频繁的系统宕机事件带来最直观的负面影响就是影响投资者交易体验,投资者无法正常管理资产、执行交易,导致投资者对经营机构的信任度下降,投资者担心账户安全、交易系统稳定性和金融服务是否可信,而在金融行业里,信任是十分难以建立且脆弱的,投资者可能因此放弃使用这家经营机构的技术系统和金融产品;最长远的负面影响就是监管处罚,监管机构可能会由于频繁的宕机事件对经营机构处以罚款、暂停业务的处罚,甚至可能影响金融科技创新试点、新业务资质的通过;最强烈的负面影响就是经营机构需要因宕机事件额外支出资金更新技术基础设施、提升网络安全能力、完善风险管理体系,以此提高各种金融服务的可靠性和稳定性。
因此,经营机构在提供服务时在信息技术系统上的首要目标就是保证服务的可靠性和稳定性,一方面要强化信息技术系统的稳定性,尽量避免出现宕机事件;另一方面,要做好系统稳定性监测,保证在宕机事件发生时,迅速切换到备用系统,继续支持金融服务,并按照要求向监管汇报恢复进度。
摘自华锐研究所《金融科技洞察》
声 明
本报告由华锐研究所提供,所载内容反映的是截至报告发表日的判断,如所载内容出现变动,我们将及时补充、修订或更新内容及观点。本报告版权属于华锐研究所,如需引用本文,请明确注明引自华锐研究所。
继续阅读
阅读原文