数字远程监测下的运维方式
作者:Kim Povlsen
当今时代,有关本地与云端部署间差异的话题无论如何难以避免,那么小编今天要说什么何特别之处呢?这一次我们讨论的是DCIM(数据中心基础设施管理),以及本地部署与云端部署谁更有优势。
小提示:二者之中有一种方式优势更显著。你是否能猜到是哪一个?
首先,让我们了解一下什么是DCIM。它是用于实现关键基础设施的可视化的软件,从而监控这些设施的性能、能源消耗和环境条件等。DCIM有多重要?简而言之:在进行IT基础设施运维时,如果没有DCIM,就像开车时挡风玻璃被遮挡了大部分一样。灾难随时可能到来。
因此,如果您的需求是:IT设施运行良好、高效,停机时间越短越好、甚至为零,那么使用DCIM就是一个非常好的主意。但是,应该在本地部署还是云端运行DCIM呢?
本地部署
本地部署的管理软件从整个基础设施的传感器捕获数据。这些数据可告知管理员基础设施的可用性、气流、功耗、温度、湿度和安全性。这些都是需要持续关注的领域;任何一处故障都可能导致意外停机。而停机时间会导致数千甚至数百万美元的损失,对董事会、高管,以及无法访问产品和资源的客户都有重大影响,因此避免停机是第一要务。
本地DCIM会在问题发生时告知用户,发送告警并在监视界面显示,以便技术人员(或技术团队)能立即采取措施,排除问题。这并不是完美的解决方案,因为停机可能已经发生,但至少故障能够得到及时处理。
云端部署
使用云端解决方案,可获得更多功能和能力,尤其对于分布式IT环境的管理。用户将获得本地部署版本的所有功能,以及更强的可见性和机器学习功能,这将显著加大避免停机的成功几率。因此,技术人员可在造成破坏前预先发现和修复问题。云端方案还能够连接到数据湖,存储来自数据中心和边缘站点的信息。随着AI和机器学习的使用,这些数据可转化为可行建议,以改进操作。
举例来说,用户不必制定单独的单相UPS维护计划。通过分析,用户可确定电池或设备本身是否需要更换。通过查看电池的放电和充电频次,用户可决定更换电池的时间。机器学习帮助用户最大限度延长资产的生命周期,消除故障风险并可确保业务连续性。
上述功能的实现归功于机器学习的工作原理——即收集大量关于使用方式和趋势的操作数据,界定出“正常状态”。当出现偏离正常状态的情况时,比如电池发热、管道导致进水,或未授权人员进入机房,系统就会发出告警。云端系统使用机器学习来整合设备行为告警。技术人员会识别“正常”和“异常”告警,关注并纠正异常情况。
云端部署的优势
好吧,你早知道结论会是这样。您应当考虑采用云端部署而非本地部署,原因如下:
出于安全考虑,一些公司可能对基于云的模式心存疑虑,但那些尝试本地和云端解决方案并行的用户通常会选择在云端部署,因为他们发现云端系统的安全性非常高——在某些方面甚至优于本地系统。例如,自动更新(含安全补丁),可使系统免受最新网络威胁。
了解远程监控如何改变数据中心的运维,请下载白皮书:数字远程监测及其如何改变数据中心的运行和维护。