目前公司系统监控通信网络的手段仍然采用传统的人工监控设备专业网管、人为判断分析故障的方式,缺乏对整个通信网进行全景监测的手段和方法,没有对整个通信网运行状态进行科学全面的评判,无法实现通信故障的事前预警。随着电力通信网规模的不断扩大、通信业务数量的急剧膨胀,特高压电网对电力通信网的要求也越来越高,现有运维方式已远远无法适应更大规模集中调控与精益化管理的现代电力信息通信运维体系要求。要利用大数据、云计算等新兴技术,开展多维数据挖掘和分析工作,最大限度地提高通信设备的运行效率和人员的运维质量。
1.基于图论评估方法。基于图论的评估方法主要集中在研究网络拓扑结构的连通性上,研究任意网点和特定两点之间通信的可能性,以及能够进行通信的节点对的数量。这方面的研究大致可分为两部分:硬件状态评估和软件状态评估。硬件状态评估研究的是物理节点和链路所构成的拓扑结构的连通性情况:软件可靠性研究的是路由算法、网路组织、维护和网管对通信网运行状态的影响。在公网领域多采用这种方法,其通常从传输设备和光缆线路(含通信管道)两大层面对网络的资源利用率、网络安全性和网络可维护性三个方面进行分析和评估,通过建立采用量化评估体系,最终实现对整体网络运行状态的评估。
2.基于专家系统评估方法。基于专家系统的评估方法主要利用行业专家的经验,通过与模糊逻辑、故障树、机器学习、多值逻辑和人工神经网络等理论和方法相结合,运用各种规则(专家经验)进行推理,最终给出网络评估结论。在电网领域多采用这种方法,根据厂家建议值、行业标准值和专家经验值,制定了《输变电设备状态评价导则》以及相关的子导则,通过以电网设备的可靠性参数、状态参数、技术参数、环境参数为基础变量,设定各部件的权重和扣分值,经过汇总计算后,最终给出电网设备的状态评价。
3.数据驱动评估方法。基于数据驱动的故障诊断方法就是利用设备长期积累的在线或离线的状态数据,利用统计分析模式、神经网络技术或支持向量机模型分类等方法,根据系统过程变量统计特性的可重复性,对设备状态进行综合识别和分类,得到最终的状态评价。特别是云计算、大数据技术等新兴技术的兴起,通过对海量数据的综合分析可以从多变量样本空间中找出有价值的信息,从而为状态评价提供数据支撑。目前,基于数据驱动的评估方法已成为状态评估的研究方向。
大数据技术
大数据技术被设计用在成本可接受范围内,通过非常快速的采集、发现和分析,从巨量的、多类型的数据中提取价值,是IT领域的新一代技术架构。目前大数据的研究和应用主要集中在数据的管理与利用、信息服务、行业调整和关键技术四个方面。在电力通信领域,日常运维管理和通信管理系统的建设部署已经积累了海量的资源数据、告警事件和日常运维记录,如果利用大数据技术可以在网络优化、网络规划和资源检索等方面进行运用。
分布式计算技术
分布式计算利用多台计算机平衡计算负载,从而合理有效地利用计算资源,具有很高的计算效率和很强的横向扩展能力。分布式计算根据计算所需数据存储方式的不同可为分布式批计算、分布式流计算、分布式内存计算。分布式批处理首先将数据采集并存储,然后以存储的“静态数据”为基础,通过用户的处理逻辑对存储数据进行计算输出结果,整个过程中数据是被动的、固定的,处理逻辑是主动的、变化的。分布式流计算是专门针对大量实时数据准备的,在流数据不断变化的运动过程中实时地进行分析,整个过程数据是主动的、持续变化的,处理逻辑是被动的、不变的。分布式内存计算则是将计算所需的数据事先缓存到集群节点的内存中,利用内存的高速存取能力,实现高效计算。利用分布式计算可以在告警事件处理、通信状态评估、通道路由分析等方面进行运用。
非关系型数据库技术
非关系型数据库(NoSQL)被广泛用于解决大规模数据集合,多重数据种类带来的挑战,尤其是大数据应用难题。从存储模式维度大致将非关系型数据库分为4类:键值存储数据库、列存储数据库、文档型数据库、图形数据库。
由于电力通信运行状态的评估需要不间断的对通信网络产生的大量事件进行处理,其中状态量数据量多,数据上报频度高,追述周期长,给数据处理、存储和并发性能带来挑战。特别是随着网络规模的不断扩大、监视范围的不断延伸,这些价值含量相对较低的原始数据存储已成为数据持久化处理的瓶颈。利用NoSQL数据库天生的快速存储和高并发、快速查询等技术特点,一方面物理上将高价值的业务数据与低价值含量的历史数据分离,提高系统优化过程的抗风险能力,另一方面,通过针对性的模型设计和技术选型,可以将处理重点聚焦在存储和定制查询上,提高存储组件的数据吞吐能力。
研究思路
基于多策略均衡的通信网运行状态评估的基本思路为:从反映网络运行状态的指标出发,进行无量纲化后按均衡策略进行加权组合,最终得到综合评价指标。其主要研究步骤如下图所示。
✎ 基础数据收集与分析。指对网络现状进行分析、收集现有的基础数据,对采集的数据进行统计归类,这些是网络评估和优化的基础。收集的数据是否全面、科学、准确将影响后续的流程。
✎ 指标体系构建。综合各方面的经验,根据影响通信网运行状态的因素进行系统分析,筛选出能够反映电力通信网运行中不同系统、不同层面的统计信息。通过归纳整理,得到各种影响指标,进一步形成评估指标体系。
✎ 指标指数化。由于各指标的属性不同,有的为正,有的为负,有定量值,有定性值,因此指数化就是对其进行无量纲化处理,取其相对值,从而统一状态评估的各指标值。
✎多策略计算指标。由于各指标对于网络状态的影响程度不同,因此需要利用多策略方法设定各指标的权重,以表明各指标对于通信网络状态的相对重要程度。权重的具体确定可采用直接给出法、层次分析法等。
✎评估网络运行状态。依据专家的经验和知识水平,计算汇总得到整体目标值,并进行定性评价。
基础数据收集与分析
传输系统的状态信息是开展运行状态评估的基础条件,为了科学评估传输系统的运行状态,运行状态的信息收集应遵循及时性、准确性、完整性和规范性原则。在实际评估过程中,传输系统涉及的状态信息种类繁多,大体可分为三大类。
✎ 传输系统履历信息。传输系统中各类设备的技术参数,包括设备类型、投运时间、生产厂家、版本型号、网络拓扑等。
✎ 传输系统运行信息。传输系统中各类设备的故障情况、资源使用信息、业务通道占用信息、检测信息等。
✎ 传输系统检修信息。传输系统中各类设备的检修信息、返修信息、消缺处理信息等。
在技术实现上,可采用大数据技术从通信管理系统获得告警、性能、履历等结构化数据,从运行日志、年度方式中获取运行、检修等非结构化数据,扩大数据获取范围,从而为后续的综合分析提供数据支撑。
网络评估指标体系构建
根据现有的条件,筛选出能够反映现有通信网运行中不同系统、不同层面的设备履历数据、运行数据和历史运维数据等信息。通过归纳整理,得到各种影响指标,进一步形成评估指标体系。通信网运行状态指标主要从完备率、可靠性和可扩展性三大方面进行分析和评估,根据生产厂家推荐的性能参数值及历史运维数据设定参考阀值,并参考国网公司相关规章制度对参考阀值进行修正,建立量化评估体系。
各个指标层由若干个指标组成,根据获取的基础数据,结合实际的管理需求进行综合计算。
✎ 完备率
重点用于描述传输系统的网络覆盖和网络保障能力。可以考虑选取逻辑拓扑成环率、重要业务双通道率、计划检修完成率和备品备件完好率等指标。
✎ 可靠性
重点用于描述传输系统当前的运行状态和故障发生频率。可以考虑选取光缆老化率、设备老化率、设备完好率、业务保障率、消缺及时率等指标。
✎ 可扩展性
重点用于描述传输系统的网络资源使用率和未来发展空间。可以考虑选取平均纤芯占用率、槽位资源占用率、2 M端口使用率和通道容量利用率等指标。
以设备完好率为例,其可按照设备厂家、设备类型、投运年限、区域分类、故障类型、故障频率、故障时长、检修次数等影响因素进行综合分析,从而能够根据不同厂家、不同设备类型、不同投运年限、以及不同区域等维度分析故障发生的情况,评价这类设备的完好状态,为指导后续的检修工作提供指导依据。
指标指数化
由于各指标之间存在着不可公度性,为消除各指标间的差异,需要对各个指标数据进行预处理,通常有一致化处理和无量纲化处理。根据指标实际值和无量纲化结果数值的关系特征,可选择不同的数据处理方法。
多策略计算指标
依据专家的经验和知识水平,分析各组成指标对网络运行状态的影响程度,由于不同层级、不同职责人员对于各指标权重的赋值不同,且各指标的权重带有很大程度的主观因素影响,需研究提出多策略均衡的网络运行状态评估模型,同时在权重计算时可考虑利用基于对数最小二乘法(LLSM),从而提升指标计算的客观性。
网络运行状态评估
根据现网的指标数据计算出评价目标最终值,并参照电网的状态划分,可将运行状态分为良好、正常、注意、异常和重大异常五种类型。
电力通信网络具有资金密集型和技术密集型特点,资产规模大、分布地域广、技术含量高,在当前通信网络规模日益扩大、设备数量持续增多、智能化程度不断提升的背景下,通过对通信网运行状态定期进行阶段性评估,可以全面细致地掌握当前网络的情况,可以保证在原有网络投资的基础上提高网络的安全性和稳定性,优化网络资源利用率,实现网络业务规模和质量的持续提升。
End