资源报警器
资源报警器,主要针对系统时序数据进行监控,例如云主机内存使用率、物理机CPU使用率等。支持用户自定义资源报警器。
资源报警器界面
在资源报警器页面,系统提供一些默认资源报警器,如下:
- 默认许可证过期时间报警器 :默认监控云平台许可证、模块许可证和分布式存储许可证。任意许可证过期时间小于等于15天,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认物理机XFS文件系统碎片化程度百分比报警器 :默认监控云平台所有XFS文件系统的物理机。任意XFS文件系统的物理机根盘,XFS文件系统碎片化程度百分比超过45%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认云盘(100GB及以上)碎片程度(Ext总数)报警器 :默认监控云平台所有XFS文件系统的云盘。任意XFS文件系统的云盘(100GB及以上)碎片程度(Extent总数)超过1000,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认主存储可用物理容量报警器 :默认监控云平台所有主存储。任意主存储可用物理容量百分比超过80%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认物理机根盘使用率报警器 :默认监控云平台所有物理机。任意物理机根盘使用率超过80%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认镜像服务器存储可用容量报警器:默认监控云平台所有镜像服务器,任意镜像服务器可用容量百分比小于20%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 默认主存储可用容量报警器:默认监控云平台所有主存储,任意主存储可用容量百分比小于20%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
- 系统数据目录磁盘容量报警器:默认监控云平台所有数据目录磁盘容量,任意管理节点数据目录磁盘占用率大于等于70%,即可触发报警。默认触发云平台消息通知,绑定接收端之后,可通过接收端接收报警消息
Note:
- 默认资源报警器(许可证过期时间除外),支持修改报警条件、持续时间、报警周期类型;
- 支持添加接收端、移除新添加的接收端;
- 不支持移除系统报警接收端、删除报警器。
创建资源报警器
除了系统提供的默认资源报警器,用户可根据自己的需求自定义创建资源报警器。在资源报警器界面,点击创建资源报警器,进入创建资源报警器界面。
创建资源报警器分为以下两步,可参考以下示例输入相应内容:
- 创建资源报警器:基本信息
- 名称:设置资源报警器名称
- 简介:可选项,可留空不填
- 资源类型:选择资源类型, 包括:云主机、路由器、镜像、镜像服务器、系统、物理机、三层网络、云盘、虚拟IP、主存储
- 报警条目:根据所选资源类型,按需选择报警条目Note:
- 每种资源类型对应多种报警条目,这里不一一列举,请按需选取;
- 某些报警条目选择后,可能需要继续填写其他参数信息,请按需设置。
- 某些报警条目需要安装agent才能使用,请按需设置。agent安装方法请参考内部监控章节。
- 报警范围:所选报警条目既涉及批量资源也涉及单个资源时,支持选择报警范围,包括:资源多选、资源单选
- 创建资源报警器:报警设置
- 报警条件:选择报警判断类型并输入阈值。可选项:>、≥、<、≤
- 持续时间:输入阈值持续时间,单位包括:秒、分、小时
- 报警周期类型:选择报警周期类型,包括:重复、一次
- 重复:
- 该报警器下同一资源的多次重复报警。例如:
- 该报警器挂载多个资源(其中任一资源满足报警条件即可触发报警),其中某一资源触发一次报警后继续满足报警条件,该报警器将遵循指定的报警策略多次重复报警。
该报警器挂载单个资源(该资源满足报警条件即可触发报警),该资源触发一次报警后继续满足报警条件,该报警器将遵循指定的报警策略多次重复报警。
- 该报警器挂载多个资源(其中任一资源满足报警条件即可触发报警),其中某一资源触发一次报警后继续满足报警条件,该报警器将遵循指定的报警策略多次重复报警。
- 接收端(若指定)将收到每次报警的报警消息,消息中心将显示每次报警的消息记录。
- 该报警器下同一资源的多次重复报警。
- 一次:
- 该报警器下同一资源的一次性报警。例如:
- 该报警器挂载多个资源(其中任一资源满足报警条件即可触发报警),其中某一资源触发一次报警后继续满足报警条件,该报警器将不再报警。
若该报警器挂载单个资源(该资源满足报警条件即可触发报警),该资源触发一次报警后继续满足报警条件,该报警器将不再报警。
- 该报警器挂载多个资源(其中任一资源满足报警条件即可触发报警),其中某一资源触发一次报警后继续满足报警条件,该报警器将不再报警。
- 接收端(若指定)将收到一次性报警的报警消息,消息中心将显示一次性报警的消息记录。
- 若该资源恢复正常后再次满足报警条件,该报警器将再次触发一次性报警。
- 该报警器下同一资源的一次性报警。
- 重复:
- 报警间隔时间:可选项,报警周期类型为重复时,可设置报警间隔时间,单位包括:秒、分、小时;也可留空不填,系统默认报警间隔时间为30分钟
- 开启报警恢复通知:可选项,默认不勾选,系统不会接收到报警恢复通知;若勾选,当该报警器监控的任一资源从报警状态恢复,则会接收到一次恢复通知。恢复通知按照默认恢复消息模板发送,消息内容可在报警消息模板页面进行自定义设置。
- 接收端:可选项,不填表示不指定接收端;若填写,报警消息将会发送到指定接收端Note:
- 支持添加多个接收端;
- 可选择系统默认的接收端,也可用户自定义创建;
- 创建接收端请参考接收端章节。
资源报警器支持的操作
资源报警器支持以下操作:
- 创建:创建一个资源报警器
- 启用:将已停用的资源报警器启用
- 停用:将正在使用的资源报警器停用
- 添加接收端:给选中的资源报警器添加接收端
- 移除接收端:将接收端从资源报警器移除
- 删除:删除一个资源报警器,删除报警器的同时将移除其上所有资源并不再报警,请谨慎操作
- 修改名称和简介:修改资源报警器的名称和简介
- 修改报警条件、持续时间、报警周期类型、报警间隔时间、是否接收报警恢复通知:修改资源报警器相关参数,包括报警条件、持续时间、报警周期类型、报警间隔时间
- 查看报警记录:支持设置时间段,可查看所设时间段内资源报警器发出的报警记录
- 审计:查看此资源报警器的相关操作




