无论您的服务器是在Windows还是Unix上运行,这些关键性能领域都可以作为任何服务器监控策略的良好起点,跟踪这些性能指标作为性能瓶颈的指标非常重要。那么如何监控服务器性能?
1、中央处理器 (CPU) 和内存
每当服务器性能下降时,通常会怀疑服务器CPU利用率和内存资源。如果您的服务器的CPU使用率异常高或内存使用率很高(可用的可用内存空间较少),您的应用程序的性能将受到影响。
很高兴知道服务器上最消耗 CPU 和内存的进程是什么。这对于快速修复资源使用问题很重要。要测量的指标包括 CPU 进程计数、CPU 线程计数和 CPU % 中断时间。
您需要监控服务器的内存使用情况。这包括可用的可用内存、写入速率页面以释放物理内存空间等。所有这些指标都可以帮助您随时了解服务器的运行状况。
2、服务器正常运行时间
您的网站必须全天候运行并可用。服务器正常运行时间衡量系统运行的时间量。当系统可能在不知不觉中重新启动时,此指标可用于提醒您。
如果您发现预期的服务器可用性周期与服务器正常运行时间数据之间存在差异,则系统至少发生了一次故障。确认所有预计在系统发生故障时运行的计划任务是否已完成。
3、磁盘活动
磁盘活动是磁盘驱动器主动处理请求所花费的时间。必须监控几个关键指标:
磁盘繁忙时间 - 测量磁盘处于活动状态的时间百分比。如果这个值很高,这意味着你访问磁盘的请求正在堆积。
输入和输出操作 (I/OP) – 指示磁盘驱动器上的工作负载。监控此指标有助于了解您的磁盘正在承受的工作负载。
磁盘读/写——测量从磁盘读/写数据块所花费的时间。较低的值意味着性能良好。
磁盘队列长度——衡量为队列中的请求提供服务所花费的时间。为了获得最佳性能,磁盘队列长度应该最小。
请注意,监视磁盘的性能对于 I/OP 密集型任务非常重要。
4、页面文件使用
未使用或未访问的数据存储在页面文件中。超出操作系统 (OS)有限随机存取存储器 (RAM)空间的操作也会发送到页面文件中进行存储。
当您发现它的使用率很高时,这意味着系统的页面文件不足以满足您的服务器的需求。
另一个重要指标是页面交换。每当您的服务器工作内存不足时,都会保留一块磁盘空间来临时保存数据,从而释放更多空间。我们不建议页面交换。通常,这意味着您没有配置足够的内存来运行您的服务器。
请记住,页面交换是内存容量耗尽的短期解决方案。由于页面交换减少了响应时间,因此应该避免这种情况。
5、上下文切换
上下文切换是一个密集的过程。它发生在内核(计算机操作系统核心的计算机程序)将处理器从一个进程或线程切换到另一个时。每次发生上下文切换时都会使用 CPU 资源。所以当发生大范围的上下文切换时,会占用越来越多重要的 CPU 资源。
这是由运行多个繁忙进程或应用程序错误导致的,这些错误会增加上下文切换的次数。服务器上上下文切换的突然增加可能表明存在问题。因此,监视上下文切换对于服务器的性能至关重要。
6、时间同步
同一网络上共享文件或相互通信的系统具有有时限的活动。那么,想象一下系统时钟是否不同步?结果可能是灾难性的。
不准确的时钟可能会导致数据被覆盖或产生版本冲突。更糟糕的是,它可能导致程序无法正常运行。始终根据参考时钟监控系统时钟偏移。
7、处理用法
句柄是指应用程序引用的资源。在您的服务器上运行的应用程序请求和接收资源使用它们,然后将它们返回给操作系统。有时,由于程序错误,应用程序“忘记”在使用后返回句柄。这是句柄泄漏。
请记住,服务器上的资源是有限的。随着时间的推移,重复的句柄泄漏可能会“耗尽”服务器,从而导致服务器的性能下降。随着时间的推移密切监控和处理使用情况。如果打开句柄的数量急剧或持续增加,这可能意味着句柄泄漏。
您需要调查并确定罪魁祸首。您可以终止此类进程或修补程序。
8、过程活动
可能存在应用程序创建新进程而不停止先前启动的进程的情况。跨这些进程的处理和多任务处理会给您的服务器带来负担。
结果,您的服务器性能将受到严重影响。确保应用程序正确运行并正确退出。为此,您需要跟踪和监控服务器上的所有流程活动。
9、网络流量
网络活动监控对于衡量服务器性能至关重要。每个网络接口都提供网络活动负载的指示。如果带宽使用量接近网络接口的最大速度,这可能表明存在瓶颈。
通过持续监控网卡上的输入和输出 (I/O)活动,您可以发现可能的硬件故障或过载。您还可以规划硬件要求以确保最佳服务器性能。
10、TCP 活动
您的应用程序是面向连接的。他们使用TCP作为传输协议。HTTP、SQL、SMTP 在下面使用 TCP。如果 TCP 层性能下降,应用程序的性能也会下降。
有几个重要的指标有助于监控 TCP:
进出服务器的连接速率有助于指示服务器工作负载。
服务器上的连接断开数。高数字可能表明存在问题。
重传百分比——当服务器没有收到来自客户端的确认时发生重传。超时后,服务器必须再次发送传输。为确保良好的 TCP 性能,请尽量减少重传。请记住,重复重传可能会导致吞吐量严重下降。
11、操作系统日志文件
监控服务器运行状况的最常用方法可能是操作系统日志,因为它们包含错误详细信息、崩溃和其他类型的异常,可帮助您解决任何问题。
虽然Windows提供系统、安全和应用程序日志文件,但Unix将系统日志和 cron 日志文件存储在 /var/log 目录中。定期对日志事件进行监控、分析和警报有助于提醒您注意任何服务器异常。
审核编辑 黄昊宇
全部0条评论
快来发表一下你的评论吧 !