为了有效地维护服务器,服务器管理员必须执行主动的硬件和软件检查。而服务器的维护清单必须包括除尘、日志查看、软件补丁程序测试等。
即使具有服务器的性能和冗余功能,增加的工作负载整合和可靠性期望也会对服务器硬件造成损害。
服务器维护清单应涵盖物理元素以及系统的软件层配置。还必须考虑到以下事实:彻底维护需要的时间、人工时间和测试。使用清单有助于服务器管理员定义目标,并保持IT团队的正常运转。
1.制定维护程序
服务器管理员经常忽略计划维护窗口。不要等到出现故障时才开始维护;要留出时间进行例行的服务器预防性维护。
维护频率取决于服务器设备的使用年限、数据中心和需要维护的服务器数量。例如,与部署在高效微粒空气过滤、冷却良好的数据中心中的新服务器相比,位于设备柜中的老旧服务器需要更频繁的检查。
组织可以根据供应商或第三方提供商的例行程序制定例行维护计划;如果供应商的服务合同每四个月或六个月要求进行系统检查,需要遵循这个时间表。
2.为准备停机做好准备
解决服务器维护清单上的项目之前,首先需要制定计划。这包括检查系统日志中是否有需要更加直接关注的错误或事件。如果系统日志表明特定内存模块有错误,则应订购替换的双列直插式内存(DIMM)并将其安装。同样,如果有可用的固件、操作系统或代理补丁/更新,请在计划的维护窗口之前先进行测试和审查。
制定明确的计划以使系统脱机并使其恢复服务。在进行虚拟化之前,人工智能服务器及其驻留的应用程序将需要停机才能容纳维护窗口,但这迫使服务器管理员在晚上或周末实施维护。
虚拟服务器支持迁移工作负载而不是停机,因此服务器管理员可以将应用程序迁移到其他服务器,并且只要在底层主机系统上进行服务器维护,它们就将保持可用状态。在维修之前,需要首先了解虚拟机的去向,将虚拟机迁移到选定的系统,并在关闭浪潮服务器进行维护之前验证每个工作负载是否正常运行。
此时,超算服务器管理员可以关闭服务器并将其从机架中移除。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !