产品事件列表

最近更新时间: 2019-11-22 20:39:45

云监控事件中心 产品事件 当前支持以下事件类监控信息:

  • 云服务器 | 事件中文名 | 事件英文名 | 事件类型 | 事件从属维度 | 有无恢复概念 | 事件描述 | 处理方法与建议 | | ----------- | ----------------------------------- | ---- | -------- | ------ | ---------------------------- | ---------------------------------------- | | 内核故障 | GuestCoreError | 异常事件 | 云服务器实例维度 | 无 | 操作系统内核bug或驱动问题导致操作系统内核发生致命错误 |

1.检查系统中是否有加载内核自身携带的内核驱动以外的其它内核驱动模块,尝试不要加载这些模块观察一下系统运行情况

2.关注内核与操作系统发行版的bug报告,尝试升级内核解决

3.云主机默认会开启kdump,发生panic时一般会在/var/crash下生成发生panic时的系统内存dump信息,可以利用crash工具进行分析 | | 内存OOM | GuestOom | 异常事件 | 云服务器实例维度 | 无 | 系统内存使用过载 |

1.评估当前系统所配置内存是否满足业务内存需求,如果需要更大的内存建议升级CVM内存配置

2.通过系统日志(dmesg,/var/log/messages等)查看OOM发生时kill掉的进程,查看进程内存使用是否符合预期,通过valgrind等工具分析是否存在内存泄露 | | ping不可达 | PingUnreachable | 异常事件 | 云服务器实例维度 | 有 | 云服务器网络ping不可达 |

1.检查云主机当前的运行状态是否正常,如果发生了系统挂死等情况,可以从控制台重启(强制重启)恢复

2.如果云主机当前运行正常,检查云主机网络配置,包括:云主机内部的网路服务、防火墙、云主机安全组设置等 | | 磁盘只读 | DiskReadonly | 异常事件 | 云服务器实例维度 | 有 | 磁盘无法写入数据 |

1.检查磁盘的存储是否存在已满情况

2.Linux操作系统可以查看的inode(df -i)是否有耗尽的情况

3.检查文件系统是否损坏 | | 机器重启 | GuestReboot | 状态变更 | 云服务器实例维度 | 有 | 云服务器重启 | 当云服务器被重启的时候,会触发该事件,请根据实际情况查看状态变更是否符合预期 | | 外网出带宽超限导致丢包 | PacketDroppedByQosWanOutBandwidth | 异常事件 | 云服务器实例维度 | 有 | 云服务器实例外网出带宽超过主机的外网出带宽限制导致丢包 | 提高外网带宽上限。如果已达到可购买的最高上限,可通过负载均衡等方式降低单机带宽 | | 连接数超限导致丢包 | PacketDroppedByQosConnectionSession | 异常事件 | 云服务器实例维度 | 有 | 云服务器实例连接数过多导致丢包 | 联系售后服务人员 |

  • 负载均衡 | 事件中文名 | 事件英文名 | 事件类型 | 事件从属维度 | 有无恢复概念 | 事件描述 | 处理方法与建议 | | --------- | ------------------ | ---- | --------- | ------ | ---------------------- | ----------------- | | 外网ip被封堵 | VipBlockInfo | 异常事件 | 负载均衡实例维度 | 有 | 负载均衡公网ip被攻击,安全侧检测异常后封堵 | 提工单查询具体的封堵原因和解封策略 | | 服务器端口状态异常 | RsPortStatusChange | 异常事件 | 后端服务器端口维度 | 有 | 外网LB后端服务端口健康检查异常 | 查看后端服务端口的服务状态 |
  • VPN网关 | 事件中文名 | 事件英文名 | 事件类型 | 事件从属维度 | 有无恢复概念 | 事件描述 | 处理方法与建议 | | ----------- | ----------------------------------- | ---- | --------- | ------ | ----------------- | -------- | | 外网出带宽超限导致丢包 | PacketDroppedByQosWanOutBandwidth | 异常事件 | VPN网关实例维度 | 有 | VPN的外网出带宽超过限制导致丢包 | 提高外网带宽上限 | | 连接数超限导致丢包 | PacketDroppedByQosConnectionSession | 异常事件 | VPN网关实例维度 | 有 | VPN网关实例连接数过多导致丢包 | 联系售后服务人员 |
  • 容器服务 | 事件中文名 | 事件英文名 | 事件类型 | 事件从属维度 | 有无恢复概念 | 事件描述 | 处理方法与建议 | | ---------- | ------------------------- | ---- | ------ | ------ | ---------------------------------------- | :--------------------------------------- | | 节点异常 | NodeNotReady | 异常事件 | 集群维度 | 有 | 节点异常可能由多种原因导致,例如网络不通,节点kubelet异常,容器造成OOM等都会致使此异常发生。节点长时间异常,会造成kubenetes主动驱逐该节点上的容器。 |

1.首先排查节点在CVM页面是否运行中,监控是否有异常。

2.登陆到子机查看kubelet是否运行正常。

3.登陆到子机查看docker是否运行正常 | | 节点磁盘空间将要耗尽 | NodeHasDiskPressure | 异常事件 | 集群维度 | 有 | 节点上容器和镜像存储所用到的磁盘(cbs或者root)空间将要耗尽,如果耗尽,将触发NodeOutOfDisk,会致使新的容器无法在被调度到此节点 | 清理磁盘或者无用的容器镜像 | | 节点磁盘空间已耗尽 | NodeOutOfDisk | 异常事件 | 集群维度 | 有 | 节点上容器和镜像存储所用到的磁盘(cbs或者root)空间已经耗尽,新的容器无法在被调度到此节点 | 清理磁盘或者无用的容器镜像 | | 节点内存将要耗尽 | NodeHasInsufficientMemory | 异常事件 | 集群维度 | 有 | 节点内存使用率偏高 | 扩容或者调度容器到其他节点 | | 节点OOM | SystemOOM | 异常事件 | 集群维度 | 无 | 节点由于内存过高而发生OOM | 检查当前节点上触发OOM的原因,例如查看监控,syslog,demsg等 | | 节点节点网络不可达 | NodeNetworkUnavailable | 异常事件 | 集群维度 | 无 | 节点上网络没有被正确配置, 正常情况下,从控制台或云API创建的集群不会出现此问题。 | 及时提交工单或与售后服务人员联系 | | 节点Inode不足 | NodeInodePressure | 异常事件 | 集群维度 | 无 | 节点Inode不足会造成节点无法创建新的容器 | 检查节点上Inode的剩余情况,可以尝试清理无用的容器镜像释放Inode空间 |