VOLTA沃塔蓄电池VT1265 12V65AH自动化系统
接触过数据中心维护这块的同学应该知道,数据中心工程人员和维护人员基本上就是维持这样一个原则:不损坏,就不动。这种情况并不是个例,可以说是常态了。这几年用户对数据新需求的增加和日益严峻的安全风险,需要数据中心管理人员逐步的改变自己的过去的工作方式,需要从过去的被动工作模式逐步的向主动模式改变,需要主动的配合上面业务方使已有的基础设施资源的效率发挥到大,加快应用程序和基础的IT设施的发展。
上文中我们已经了解到未来的技术发展对数据中心现代化的迫切需求,企业要想有效实现数据中心的现代化面临着很多的前期工作,从笔者了解到的一些业界的数据中心改造项目来看后续的整个现代化的过程需要投入大量的时间和成本,但数据中心现代化需要付出的代价从长远看来是值得的。下面我们看一下目前业界在数据中心现代化改造和更新方面的具体措施。
1.技术持续更新
大部分企业数据中心中大部分时候老旧设备的更新换代是在设备损坏后才进行的,但从实际来看老旧过时的设备通常需要更多的操纵成本和维护成本,且可能会存在影响用户既有业务的风险。
针对这一点一般建议企业建立资产跟踪,对现存的每一台设备都要建立档案库,同时管理人员需要了解每一台老旧设备的使用寿命以及是否在保修期等问题。数据中心上层的云平台管理人员在上层的监控系统中发现疑似硬件设备问题时要主动联系机房管理人员进行设备的确认,因为从实际使用来看部分设备在即将出现问题但未出现问题时机房的告警平台有时是发现不了的。确认是硬件设备问题后,就需要机房的管理人员尽快进行设备的更新。
另外一般建议数据中心中都要配备基础设施管理软件(DCIM),这样在不依赖于上层的云平台管理人员的情况下数据中心管理人员也可快速的了解到即将淘汰的数据中心组件,另外数据中心管理人员也可根据DCIM系统了解到每台关键设备的电量消耗情况,从而可以在设备故障前发出告警,提醒管理人员及时介入处理。
2.制定工作流程
借助DCIM系统规范数据中心的资产管理工作,DCIM工作流可以帮助我们跟踪每个数据中心的几乎所有的资产管理工作。
数据中心管理人员在每次进行设备的配置变更时都要在DCIM系统中注明本次所做的操作、本次操作所耗时间以及本次操作额执行人等,如果本次操作中出现过异常的情况则还需要注明本次操作的注意点,防止后续管理人员在操作时再次踩坑。
一般可以专门为这些数据设置一个专属的数据库,这样可以帮助我们更加轻松的进行资源的安排、工作订单的生成,更加重要的是这样可以确保团队操作的顺利性。
增加工作流程的一致性和问责性可以帮助团队更加高效快捷的工作,从而提高企业的生产力。
3.周期性故障模拟
停电对于数据中心来说可以说是重大的故障,如果数据中心没有备用电源或者主电源中断后备用电源没有切换成功会给企业带来巨大的损失。根据美国一家公司HexaResearch的调查统计,但是美国的数据中心每年由于停电所造成的损失高达5500万美元。因此一般建议每一个数据中心都要进行电源的强化配置,在配置主备电源后也要周期性的对数据中心的供电系统进行周期性的断电测试,防止配置主备后当主电源真的被切断后备用的电源不能及时的切换。
实际的断电模拟测试中并不是直接将所有的电源切断,一般数据中心中还会根据机器的上所跑业务的重要程度配置不同的电源系统,因此数据中心的管理人员还要知悉数据中心中哪些机器是核心的机器,在进行电源断电测试时需要对核心的机器进行着重的测试。
4.混合部署
随着时间的推移,一个数据中心中的机器一般会越来越多,这么多的机器一般不会进行单一的部署,未来数据中心的战略是一种混合策略。数据中心的混合部署一般会包公有云、私有云以及基础设备的托管。
混合部署的策略的优势在于其灵活性和适应性,通过实施混合策略可以将应用程序和用户的工作负载部署在的机器上,提高机器的利用效率。
5.虚拟化改造
我们知道虚拟化不仅可以对底层的资源进行充分的利用,另外还可降低一些工作负载的风险。虽然虚拟化的系统中部分软件的性能水平不及直接部署在硬件之上的水平,但是由于大部分情况下硬件的性能并不会被榨干耗尽,而是维持在一个不高的水平之上,剩下的计算能力可以借助虚拟化进行合理的使用,因此虚拟化改造会具有更大的,灵活性和控制能力。