2、devops告警模块的设计
一、告警事故频发
最近几年,互联网大厂的服务不可用案例频繁出现在公众视野中,这些事件不仅影响了用户体验,还对公司的声誉和经济效益造成了不同程度的影响。
- 阿里云多次故障,在2023年11月12日产品控制台访问及API调用出现异常,直至晚上7点20左右恢复正常。
- 滴滴出行长时间瘫痪,2023年11月27日晚间,滴滴App发生了全国大面积崩溃,服务无法正常使用。
- 语雀8小时的服务中断事件,2023年10月23日,语雀经历了长达近8小时的服务中断事件。
...About 12 min