事件概述

最近更新时间: 2019-11-22 20:39:21

事件是信息的一种承载媒介,描述特定对象某一瞬间的非持续性变化,与唯一时刻和唯一对象关联。例如:某台计算机从运行状态变更为关机,程序运行开始和结束,办公大楼停电等。事件是对象在两个不同状态中的变更瞬间的记录。

助力发现、定位、解决问题,保障系统与服务整体的稳定与性能是监控服务的目的。而信息与数据是运维与监控的核心驱动。

指标作为主要监控信息源,以阈值类周期性持续性形态描述特定对象特定变量随时间变化的数值与趋势,从而表现资源与环境的使用情况和反映其健康状态。例如:某台云服务器的CPU利用率,数据库实例的慢查询数。 指标能覆盖绝大部分监控发现问题的场景,但仅使用指标作为监控的信息源会有以下缺点: - 信息传递延迟,指标阈值的变化可能会在特定事件发生后一段时间才会表现出来(或者不表现)。 - 传递信息的准确性辨别性不高,仅通过阈值变化来判断和定位真实事件或者问题原因难度提高。 - 承载信息维度有限,指标仅通过阈值形式记录,无法使用文字等方式提供其余补充与附带信息。

引入事件作为监控的信息载体,能更准确与直接描述资源与底层基础设施服务的运行状态,助力更高效发现、定位从而解决问题。 优点:结果导向,提高信息描述准确性;减少延迟;传递更多信息,完善监控信息维度。

 事件中心简介

云监控事件中心作为云平台事件信息中枢,产品云平台各产品资源生命周期与运转中的重要事件信息,并构建完善的事件消费渠道与流程,支撑客户云上监控与运维。 事件中心所产品化提供的事件信息,由云平台内部各产品模块与底层基础设施服务获取,经过聚合,判定和收敛再最终呈现。信息源来自各模块底层的系统日志与监控项,保障客户透传客户的信息准确性与价值。