Doris 集群告警
集群告警项
在告警模块中,可以配置告警策略。选择新建告警策略,可以根据业务创建告警项。如下图中创建了 FE 的告警策略,如果有挂掉的 FE 会发送告警通知。
配置通知推送
在告警规则中可以选择站内通知、邮箱通知、IM 工具通知及 Webhook 方式。
在使用 IM 工具,如企业微信、钉钉、飞书时,需要保证联通公网。
站内通知
-
选择站内告警
站内通知会在告警通知中推送告警信息,需要选择站内推送用户。
-
查看站内告警
当发生告警时,可以砸在左下角通知菜单中查看到告警信息。
邮箱
-
配置邮件告警
在用户菜单选择服务配置,进入配置菜单。配置邮件告警信息。
-
选择邮箱通知
选择邮箱通知方式,并填写接受告警的邮箱用户。
企业微信
-
创建企业微信群,并添加机器人
如下图中添加企业微信机器人:
-
复制机器人 Webhook
-
在 Manager 中添加机器人 Webhook
钉钉
-
创建钉钉群,并添加群机器人
如下图中,在群设置中创建钉钉群机器人:
-
选择添加 Webhook 类型机器人
-
为机器人添加关键字
钉钉机器人需要同时添加“Alert”与“告警”关键字,否则无法收到告警。
-
复制钉钉机器人 Webhook
-
为 Manager 配置钉钉机器人 Webhook
飞书
-
创建飞书群,并添加机器人
在飞书群中,选择自定义机器人:
-
复制 Webhook 地址
-
为 Manager 告警配置飞书机器人 Webhook
Webhook
Webhook 的方式表示用户可以自定义一个 API,把 API 服务的完整 URL 提供给 Manager,由 Manager 向 API 发送告警,用户的 API 中收到告警后,可以做任何其他处理。
用户收到 Manager 后发送 body 内容如下:
{
"alertContent":"[cluster_guide]testrule1\n时间:2023-12-15 17:32:56\n集群:cluster_guide\n规则名称:testrule1\n报警内容:FE Alive 小于 50.0\n",
"alertInfo":"FE Alive 小于 50.0",
"alertName":"testrule1",
"cluster":"cluster_guide",
"time":"2023-12-15 17:32:56"
}