服务器监控的基本组件和工具

2020/5/12 17:21:00

尽管服务器容量管理是数据中心运营的基本组成部分,但企业确定需要监视的组件以及可用的工具并不是容易的事情。由于虚拟化架构需求与本地处理需求不同,因此,根据你在数据中心运行的基础架构类型的不同,服务器监控的方式会有所不同。

1.jpg

通过可用的容量管理工具,你可以实时监视和优化服务器。监视工具可让你可了解资源使用情况的最新信息,并自动在设备之间分配资源,以确保持续的系统正常运行时间。

为了全面了解你的基础架构,容量管理软件应在某种程度上监视这些服务器组件。跟踪这些组件可以帮助你解决问题,并预测处理需求中的任何潜在变化。

CPU。由于CPU处理基本逻辑和I / O操作,以及为服务器中其他组件路由命令,因此它们始终处于使用状态。CPU使用率高可能表明CPU有问题,但是更有可能表明该问题与连接的组件有关。服务器中超过70%的利用率应用程序可能变得缓慢或停止响应。

内存。多个并发应用程序可能导致较高的内存使用率,但是通常耗费资源较少的错误进程可能会导致其他问题。内存硬件组件本身很少发生故障,但是当其使用率上升时,你应该调查性能。

存储区域网络。SAN组件问题可能会发生在多个地方,包括连接电缆、主机总线适配器、交换机和存储服务器本身。一台SAN服务器可以托管多个应用程序的数据,并且通常跨越多个物理站点,如果任何组件发生故障,都将对业务产生重大影响。

服务器磁盘容量。对于适当的容量的数据存储,存储磁盘有助于缓解存储问题,并减少瓶颈问题。当更多的用户访问使用特定存储位置的同一应用程序时,或者如果资源密集型进程位于不是为该应用程序设计的服务器上时,就会出现问题。如果你无法增加磁盘容量,则应在使用率增加时,对其进行监视并调查,从而可以优化将来的使用情况。

存储I / O速率。你还应该监视存储I / O速率。瓶颈和高I / O速率可能表示各种问题,包括CPU问题、磁盘容量限制、进程错误和硬件故障。

服务器的物理温度。你应该监视的另一个重要组件是服务器温度。数据中心经过冷却以防止任何硬件组件问题,但是温度会因多种原因而升高:HVAC故障、内部服务器硬件故障(CPU、RAM或母板)、外部硬件故障(交换机和电缆)或软件故障(固件)错误或应用程序问题)。

操作系统、固件和服务器应用程序。整个服务器软件堆栈必须协同工作以确保最佳使用(基本I / O系统、操作系统、虚拟机管理程序、驱动程序和应用程序)。如果没有定期更新,可能会导致服务器、任何托管的应用程序、利益相关方糟糕用户体验或停机等问题。

通过软件工具简化报告

大多数服务器监视软件都会跟踪并通知你技术堆栈中服务器的任何问题,这包括默认和自定义组件监视、自动和手动优化功能以及标准和自定义警报选项。

服务器监视的软件部分涵盖所有类型的架构,以及数据收集所需的深度和广度,下面是数据中心服务器容量监视软件的简短列表:

(1) SolarWinds服务器和应用程序监视器

SolarWinds的软件在中央枢纽中提供监视、优化和诊断工具。你可以快速实时确定哪些服务器资源满负荷,可以使用历史报告来跟踪趋势并预测资源采购。其他功能使你可以诊断和修复影响应用程序运行状况和性能的虚拟和物理存储容量瓶颈。

(2) HelpSystems Vityl Capacity Management

Vityl Capacity Management是全面的容量管理产品,可让企业轻松地主动管理性能,并在混合IT设置中进行容量规划。它提供了实时监视数据和历史趋势报告,可帮助你了解网络的运行状况和性能。

(3) BMC Software TrueSight Capacity Optimization

TrueSight Capacity Optimization产品可帮助管理员通过实时和预测功能规划、管理和优化本地和云服务器资源。它提供对多种网络类型(物理、虚拟或云)见解,并帮助你管理和预测服务器使用情况。

(4) VMware Capacity Planner

作为一种规划工具,VMware的Capacity Planner可以收集和分析有关服务器的数据,并更好地预测未来的使用情况。该预测功能可提供容量使用趋势的见解,以及基于行业性能标准的虚拟化基准。

(5) Splunk App for Infrastructure

Splunk App for Infrastructure(SAI)是一款多功能工具,它使用简化的工作流程和高级警报来监视所有网络组件。借助SAI,你可以创建自定义可视化效果和警报,以根据数据中心和报告需求通过度量标准分组和过滤来更好地进行实时监视和报告。