「会展笔记」云栖大会-绿色智能数据中心(一)飞天智维
11月3-5日,云栖大会差不多算是云计算产业的最高规格盛会,我就自己所处的IDC基础设施运维相关的分论坛进行学习并记录笔记分享给大家共同成长,后面还会有更多更新。部分视频都已经上传同名b站可以直接查看。演讲ppt可以公众号后台回复“飞天智维”获取。
UI级权限管理

要死又造新词,查都查不到的词,在演讲中好学也没有特意提到,姑且认为是可以对每个可见的内容都做权限的管理吧,之前有页面权限(菜单)权限,数据权限,功能操作权限,现在应该是进一步做了ui可见层面的限制?不然没有造新词的意义。
大基建全生命周期解决方案产品

刚好囊括了大基建项目的三个生命周期,看来阿里在新基建产业B端解决方案的布局也够超前了。而且名字也取的非常好,除了最后的飞天智维和腾讯家一样没特色的撞名之外,前面四个都感觉非常酷。不过应该还没正式对外发布,搜了一下都没查到相关资料,大家未来可以期待一下,有新进展我也同步到本号上。可以对三个不同阶段的平台进行一下猜想。
司南:基建设计管理协作审图平台,指导建设项目走在正确的路径上
垒土:土木建设工程施工过程的数智化管理,或者类似智慧工地,一步一步打好基础
山海关:传说中的“投资不过山海关”,泛化到了建设工程的验收阶段,阿里作为业主方确实需要一座山海关来当作验收标准
三个平台品牌名称都寓意满分,很期待未来给智能建筑产业带来新的变革。
接入层:IEC61850/EMS3.1/AIMS2.1/巴拿马/DR

IEC61850:一种电力系统自动化领域唯一通用标准
想要做智慧微电网的关键物联能力,可以囊括对发电,变电及配电设施设备的集成通讯及扩展。可见阿里野心之大,原来纯粹的数据中心都是一个用能建筑,几乎过多潜入到外部电网领域的范畴
这种通讯协议同样是面向对象的,与网络拓扑关系表现方式详尽,完全可以通过cmdb统一来管控
EMS3.1/AIMS2.1:两个都搜不到的协议。。
电力巴拿马架构:一种数据中心供电架构,特点是比高压直流、UPS供电还少很多损耗

DR配电架构:一种不同于2N,的配电架构
看图和冷库系统里面2台冷风机分别由不同冷冻机供液的思路一致,胡做备份冗余,uptime中T4级别有,但国内的50174规范没提及,故国内应该实际项目不多。
另外还有一种RR架构,不同点在每个it负载上端都安装一个STS,静态转换开关切换速度<5ms,远快过ATS。

功能:智能温升告警
解决的问题
多余告警收敛及定位故障位置
比确定阈值的告警要提前,并能抓到运营商发生异常不上报的运维事故

还原场景
冷水管破裂导致大规模缓慢温升,实现提前50分钟发现告警并报告警收敛成为2条。制冷量不足,但是根据系统的滞后性确实不会马上发生温升,并且破裂不是完全没有冷冻水可以打到末端只是回去的水量不足。提前做的单机柜温度模型能够检测出来失温的斜率与之前的精密空调的波动模型无法匹配,并且是斜率大于预设安全范围,即迅速发出告警,并且根据图谱进行关联分析,所有的机柜温度模型都是异常状态,直接可以收敛成为楼层温升告警,这时候第一个优先巡检人员去排查的问题,肯定就是当楼层的冷冻水的支路是否存在破裂和漏水,大大降低排查的时间投入。
原理逻辑思考
本质上就是建立了一个机柜的温度波动模型,因为机柜的温度波动会与精密空调出风口的距离,上架状态密切相关,就只能对每个独立机柜进行建模,当机柜温度波动变化不在预设模型范围趋势内,并且通过关联分析校验当前机柜周边机柜的实时温度场情况,如果都是相关的波动,那即可以排除单体传感器异常,或者人员现场作业导致的特殊升温的异常情况,并提前拉出告警。
实现困难点

