注意:以下文档只适用于TOP接口,请谨慎使用!
入口:https://console.cloud.tmall.com/component/monitoralarm#/index
前言:聚石塔告警管理功能——监控应用容器POD的各项指标,提供钉钉、邮件告警。
主要有4个模块功能:应用告警、告警模板、告警规则、报警历史
1.根据相应的应用、环境可以创建相应的实例告警
2.告警联系人角色:钉钉、邮件告警信息会发送给指定的角色成员
角色分为负责人、开发、测试、运维角色。应用编辑里可以设置角色对应的成员,如下图:
1.可以查看应用告警的基本信息
2.可以编辑、启用、禁用、删除规则以及查询规则对应的报警历史
统一管理应用分组下的告警规则
新建模板时,会默认配置以下告警规则,如下图:
告警模板也支持手工添加其他告警规则,如下图:
告警规则名词解释:
1.告警规则名称:自定义告警规则名称
2.监控维度:目前只支持应用POD实例维度
3.监控指标:应用POD监控指标
4.通道沉默周期:报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。默认为60分钟
5.开始生效时间:规则每天发送告警的开始时间
6.结束生效日期:规则每天发送告警的结束日期
7.报警级别:分为Critical、Warn、Info级别,至少需要设置一个级别的报警
8.持续X个周期(1周期=1分钟):监控指标的阀值只有满足X个周期时,才会发送钉钉、邮件告警消息给用户
告警模板创建成功之后,在告警模板列表页,可以一键应用到分组,如下图:
展示该用户下设置的所有告警规则,支持禁用、启用规则操作以及查询报警历史
展示该用户下所有的规则报警历史