CaaS巡检指南

You might also like

You are on page 1of 5

CaaS 巡检指南

版本 4.2.0 平台巡检
概况
云平台巡检报告 巡检人 admin
巡检时间 节点规模 3
平台版本 CaaS-4.2.0 监控平台地址
存储概况 总容量:483.15G 使用率:16%
CPU 数量 总容量:12 使用率:45%
内存情况 总容量:46.53G 使用率:39%

云资源 WEB 界面巡检


平台概览上查看关于存储、cpu 、内存使用率。

平台监控告警查看自定义和内置策略告警消息。
平台监控告警查看集群状态,查看集群节点状态、组件状态。

平台监控告警查看应用资源,查看应用使用情况和用量排行。
平台应用负载容器组查看容器组状态是否正常。

云资源后台命令行巡检
查看 k8s 版本
#kubectl version

外置存储概况
#kubectl get pv
集群对外暴露的端口
#kubectl get svc -A |grep -i NodePort
服务器操作系统巡检
查看/、/var/lib/kubelet、/var/lib/docker 或/var/lib/containerd 的剩余空间,剩余是否超过 20%
#df -h

云平台服务状态巡检
确认是否有相关容器组状态异常。
#kubectl get pod -A -o wide |grep -v Running |grep -v Completed

 控制节点执行命令检查服务
检查节点状态
#kubectl get node

检查 etcd 服务
#systemctl status ki-etcd.service

 所有节点执行命令检查服务
检查 kubelet 服务
#systemctl status kubelet.service
检查 docker 或 containerd 服务
#systemctl status docker.service
#systemctl status containerd.service

You might also like