[机房]你建的数据中心真可靠吗?

2022/4/17 10:18:00

冗余设备广泛应用于数据中心行业,实现更高的系统可用性,通常要求其范围为99.999%(5个9)。然而,所需的冗余水平取决于设备的可靠性。

例如, text-indent: 0;'>1

P-F曲线是以可靠性为中心的维护(RCM)的基本原理,可以在没有详细分析的情况下成功应用。许多性工具可以显著改善资产的状况和使用寿命。

解决方案:实施可靠性计划

2017年,数据中心运营商RagingWire决定为其数据中心实施可靠性计划。公司聘请了具有生产背景的可靠性工程师。

最初的可靠性措施包括:

1.服务范围

a.

b.输入管理机构(IEEEE、ANSI/NETA、ASHRAE、NFPA)的OEM建议和代码。

c.设备清单包括叉车、托盘电梯、电梯、防雷装置、高架门、装卸平台、阀门、供水系统等支持设备。

d.用于为所有设备创建任务列表,并计算机维护管理系统(CMMS)中为所有设备创建任务列表。

2. 计算机维护管理系统(CMMS)

制定并记录标准。

b.重新部署未使用或不需要的信息。

c.添加可靠性字段,如故障、原因、维护代码和使用寿命。

d.输入纠正内外工作活动的工作订单。

e.在公司范围内对实施的变更进行培训。

f.为正在进行的年度培训和新员工建立培训矩阵。

g.建立每月会议的咨询团队,讨论可以改善计划的就业和变化。

h.创建详细的用户指南。

I.定期制定环境健康安全(EHS)要求,确保符合要求。

3.可靠性

A.制定责任分配路线图。

b.成立了可靠性指导小组。

4.节省成本

a.成立了包括工程和运营商在内的降低成本的团队。

b.采购团队就主要设备和费用达成了协议。

c.利用服务范围,每年可节省25万美元。

5. (PM)预防性维护

a.通过在线报告建立了柴油发电机和变压器油的分析团队。

b.通过故障模式和影响分析(FMEA)优化关键设备的预防性维护(PM)流程

6.资产管理

a.定义资产并创建列表。

b.定义了设备层次结构。

c.确定设备的关键性。

d.确定的维护策略:预防性维护(PM)、故障搜索、重新设计、运行至故障。

7. (RCA)

a.根据批准的政策和详细程序开发程序。

b.选择了根本原因分析(RCA)软件来巩固该过程。

c.培训所选项目和操作人员。

9.建立工作工作单处理的工作流

未来推出的措施

未来将计划包括:

(1)确定设备的预期使用寿命,以帮助制定资本计划。

(2)建立基于状态的预防性维护(PM)和维护(CBM)程序。

(3)利用可靠性关键绩效指标(KPI)识别持续改进的机会。

(4)创建仓库管理程序,正确识别现场所需的备件并存放,方便使用。

可靠性计划的典型效益包括降低设备故障和维护成本、提高工单效率、提高资产使用寿命和降低设备维护风险带来的更安全的环境。

此外,一些附带的好处包括资产管理和年度预算收集设备的历史记录,系统地消除故障的根本原因,以及评估和维护活动,以获得持续改进的机会。

数据中心运营商通过其新的可靠性计划节成本,提高工作效率。预计故障数据的捕获和维护过程的改进将继续提高资产的预期使用寿命,从而减少资本支出。您还可以跟踪关键指标,以确保期望与结果匹配。除了数据中心固有的冗余措施外,这是成为更可靠经济的数据中心提供商的重要一步。