服务器nova-compute down告警的问题处理

描述

故障现象

某运营商Provider界面有服务器nova-compute down告警,如下图所示。

命令

故障分析

1. 通过查看界面的告警详情,判断为该主机的nova-compute服务异常。

2. 登录到该主机的OS上,通过执行systemctl status openstack-nova-compute命令,检查状态确实异常,如下图所示。

命令

3. 检查是否是硬件和服务器资源导致的服务异常,检查结果正常,服务器资源充足,硬件无告警,如下图所示。

命令

4. 执行systemctl restart openstack-nova-compute命令,查看服务是否能正常启动,如下图所示。

命令

5. 检查/var/log/nova/nova-compute.log文件,查看服务重启失败报错原因,如下图所示。

命令

6. 通过分析日志,问题为nameserver导致。

7. 检查/etc/resolv.conf文件,如下图所示。

命令

8. 该地址无法Ping通。检查文件修改日期,如下图所示,判断为修改。

命令

故障处理

1. 确认修改文件是用户人为操作,修改该地址为用户自用地址,影响服务启动。2. 还原配置文件,重启服务后问题解决。

审核编辑:汤梓红

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分