摘要:长期以来,由于缺乏量化和智能化的科学管理手段,基站动环系统运行维护管理相对粗放。应用TOP N管理方法,能持续针对薄弱环节改进,适用于铁塔共享基站动环运维管理,提高整网站点管理水平。采用断站时长TOP N管理,能够有效提升铁塔动力保障服务质量;采用应急发电次数TOP N管理,能够指导通过动态调整实现站点动环系统精准配置,降低应急发电成本;采用低能效站点TOP N管理,能够降低电费成本,最大化能源效率。
代维是基站动环系统运行维护的主要模式。除基站巡检和应急发电工作外,代维工作还包括设备日常维护、故障处理、定期测试保养等,并配合进行备件送修返修、升级扩容、资产管理、报告分析等。从代维工作职责来看,通过应急处理保障基站正常运行是代维团队的主要目标,并不涉及动力系统配置优化、节能减排等工作。
通过对部分区域应急发电保障工作分析,基站发生停电后,断站概率高达50%左右,发生断站的原因包括电池配置容量不足或未配置电池、电池剩余容量不足甚至损坏、因高山不能发电或业主阻挠发电、移动油机故障、大面积停电等多种复杂因素,应急发电队伍一般不具备方案分析能力,也没有优化基站动力保障系统配置的职责,此外,应急发电是代维收入来源之一,因而缺乏对减少应急发电次数、降低应急发电成本的驱动力,形成了断站率高、发电成本高的双重问题局面,传统的基站动环运维管理方式相对粗放。
木桶理论众所周知,一只水桶能装多少水取决于它最短的那块木板,也可称为短板效应。任何一个系统或组织,都会面临的一个共同问题,即构成系统或组织的各个部分往往优劣不齐,而劣势部分会决定整个系统或组织的水平。因此,找到短板并尽早补足,是改进之道。
针对一个管理目标,定期将问题最多的组成部分或项目列出进行重点改进,就是TOP N管理。如果能将管理目标量化,就能通过IT手段实现自动TOP N管理。如在基站动环运维管理中,通过动环监控系统按一定周期(如一个月或一个季度)向运维团队发出TOP N问题基站改进工单,运维团队在接到该工单后,自动得到下阶段工作目标,即问题基站和管理指标均得到改进。
问题基站得到改进的判断依据是:上期TOP N问题基站中的大多数(如80%)不再出现在下期的TOP N问题基站清单中;管理指标得到改进的判断依据是:下期TOP N问题基站入围指标及平均值均不得低于上期并有改进,如可将指标不低于上期设置为最低目标、5%改进设置为标准目标、10%改进设置为挑战目标。
实施TOP N管理,就是定期的站点网络网优动作。随着问题最严重的基站不断得到改进,全网管理指标不断上升并向最佳逼近,实现精细化管理,打造精品站点网管成为现实可能。
面对海量基站运维,可以分类别、分区域实施TOP N管理。针对断站时长、应急发电次数和低能效三个关键方面实施TOP N管理手段,能够实现基站动环系统精准配置,并通过动态配置调整,在提升服务质量的同时降低总成本。
根据长期以来基站运维数据分析,动环因素导致基站网络中断的比例超过50%,断站时长或断站率是体现基站动环运维质量的关键指标。针对区域内重点基站和一般基站,通过网管系统分别按每月或每季度统计断站时长TOP N站点,自动将改进工单下发至区域维护团队,区域维护团队通过加强组织管理或优化动力保障配置等方式,改善短板基站供电质量。维护团队可据此对应急发电不及时、移动油机维护不到位情况进行处罚,同时奖励优秀运维小组,改进运维管理质量;技术专家聚焦于TOP N基站,分析并优化移动油机或其它发电设备配置、安装固定油机或采用叠光手段、增配或更换老旧蓄电池等方式,使动力保障有更好的基础。
如根据某市2015年3月份数据统计,共计发生1893次断站,涉及1321个站点,平均断站时长1.46小时,总断站时长2765小时。下表是评估分别采用断站率、断站时长TOP 20、TOP 50站点管理改进效果。
方法论 |
对比项目 |
断站次数TOP 20 |
断站次数TOP 50 |
断站时长TOP 20 |
断站时长TOP 50 |
按次数 |
入围断站次数(次) |
7 |
4 |
1 |
1 |
入围站点总断站次数(次) |
213 |
354 |
74 |
161 |
|
入围站点平均断站次数(次) |
10.65 |
7.08 |
3.7 |
3.22 |
|
改进后断站次数最大下降比例 |
11.3% |
18.7% |
3.9% |
8.5% |
|
按时长 |
入围断站时长(小时) |
1.69 |
0.89 |
19.09 |
11.45 |
入围站点断站总时长(小时) |
237 |
435 |
523 |
959 |
|
入围站点平均断站时长(小时) |
11.84 |
8.69 |
26.13 |
19.18 |
|
改进后断站时长最大下降比例 |
8.6% |
15.7% |
18.9% |
34.7% |
从上表可以看出,通过断站时长TOP 50(涉及3.8%站点)改进,断站时长最大可以下降34.7%。即使只针对TOP 20(涉及1.5%站点)改进,总断站时长最大也可下降18.9%。事实上,由于断站存在一定不确定性,实际改进幅度并不能达到理想值。由于动力系统配置情况决定停电条件下断站概率,通过断站时长TOP N站点改进可有效降低总断站时长。进一步分析停电数据发现,因不能发电导致断站的比例高达69.4%,绝大多数是由于业主原因无法发电,另有部分高山站点应急发电困难。当这些站点进入到断站时长TOP N管理工单后,绝大多数有解决措施,如对于高山站,可以增配电池、配置固定油机或叠光;对于业主原因导致不能发电的站点,可以采用增配电池、叠光或采用静音应急保障设备(如移动电池车、电动汽车、燃料电池等)等手段,降低断站率,减少断站时长,提升服务质量。
应急发电是基站动力保障工作的重点,是保障网络质量的关键手段。同时,全国基站应急发电相关总成本高达数十亿,具有节省挖潜空间。通过对多个区域应急发电报表分析,应急发电发生的站点和时间段都相对集中,如果改善这些站点和时间段的常规动力保障,就可以有效降低应急发电上站次数,降低发电成本。
针对应急发电次数进行TOP N管理,运维团队接收到TOP N站点改进工单后,根据这些站点停电规律分析,可针对性地依照总成本最低、投资成本较低、投资回报周期短的原则制定最佳方案,包括转供电改直供电、增配电池、站点叠光、安装固定油机等措施,减少甚至避免停电后上站发电。
例如,某市某运营商共400多个基站,2014年12月份发电77次,发电次数TOP 10基站平均发电15.64小时,平均发电次数3.8次,最长发电时长5.42小时,只有一次为夜间停电发电。由于移动油机不能在雨天发电,在相同应急保障要求条件下,对于应急发电TOP 10站点具备安装太阳能电池板条件的,可采用叠光措施,即安装仅满足通信负载需求的太阳能电池板,由开关电源统一控制和调度,优先使用太阳能的方案。以每次应急发电上站费用300元计,一个月可以节省上站费用1140元,电费节省300元左右(主设备实际平均功率为2kW)。由于12月份并非停电高峰,推算单站一年可节省1.5万元发电费用和0.4万元电费,与2万余元的叠光成本相比,具有极佳的投资回报,并可获得长期的电费节省。按TOP 10基站改进后每月上站应急发电次数从38次降为2次计(夜间和阴天仍需要移动油机上站发电保障),可减少发电次数36次,全市每月应急发电次数可减少47%,发电成本也同步降低。
对于不能安装太阳能电池板但适合安装固定油机的站点,选用小型固定油机和合适的电池容量,同样按照TOP N基站管理手段优化油机启停时机,通过动态参数调整达到总成本最优水平。由于油机方案总成本中维护费用占一定比例,且维护成本有逐步上升趋势,因此在同时具备叠光和固定油机安装条件时优先选用叠光方案。
长期不需要应急发电的站点,存在池过配置可能,也可以按TOP N管理方式发现并关注,必要时加以调整,如将过配置的一组电池运往其它欠配置站点进行扩容,降低投资成本。对于已安装固定油机的站点,可能由于电网改善,固定油机利用率低,也适用于TOP N管理方式发现并整改。
站点能效及站点基础设施能效,是通信主设备能耗占站点总能耗的比例,根据通信网络六环节能耗模型分析,站点能效仅50%~60%,全国百万级基站,一年电费超过200亿,有高达百亿度的耗电量并没有被通信主设备消耗,有较大节省空间。
空调(温控环节)、存量低效电源(变换环节)、外市电引电电缆(配电环节)是基站浪费能耗最多的设备或环节。当前维护队伍日常巡检的工作重点是保障设备安全运行,对能耗并不关注。由于基站数量众多,上站人员水平参差不齐,能耗浪费环节很难被发现,更难被改正。
凭借低能效TOP N站点管理手段,可以让技术专家聚焦于已发现的低能效站点,容易找到高能耗环节并采取措施。如,东北某基站冬天空调温度设置为23度,但机房密封不严,墙上有明显的孔洞,大量冷空气连续不断地进入室内,导致空调整个冬天连续加热,能耗比例很高。在基站巡检时,由于维护人员离墙孔有一定距离,并不能感受到冷风进入,而该基站负载不大,总能源并不突出,如果没有能效比较手段,很难发现问题并进行改进。
高能耗站点不一定浪费电能,同类型低能效站点一定存在浪费。通过低能效TOP N站点改进,不断将低能效站点的能源效率提高,整网能源效率也随着提升,逐步实现整网能效最大化。
采用TOP N管理手段可以能达成管理目标,但同时可能带来成本的上升,需要有智能化管理、模块化功能的基站动环系统。
智能化的基站动环系统可以称为智能站点。智能站点能够提供较为准确的电池健康度和电池剩余容量信息,使动环监控系统可以据此合理调度移动油机发电,能避免通知不及时发生断站,并能准时通知而减少不必要的应急上站;智能站点应能调度输入的能源,包括市电、油机、太阳能和电池等,也能调整负载需求,优先使用低成本能源并延长电池备电时长;智能站点能自动启停油机以保障系统可靠性、自动给出电池更换建议等;智能站点应能提供可视的站点能效指标,不需要专家投入就可进行优化;智能化基站动环系统能接收网管系统指令,优化工作逻辑,使动力保障更好,运行成本更低。
功能模块化的基站动环系统能兼容多种能源输入,在基站进入TOP N工单后,能方便地叠加固定油机,以最小代价实现固定油机管理;能直接叠光,接入太阳能电池板降低应急发电成本并节省电费;能在不改变原有系统的情况下直接接入新的电池,包括不同容量或不同类型的电池,如高频繁停电站点在铅酸电池基础上扩容锂电池等。
智能化基站仍然离不开动环网管系统的监控和管理,一方面通过百万基站运行大数据分析,能发现更有价值的工作逻辑方案并通过网管系统下发执行;另一方面TOP N管理手段需要智能的网管系统自动形成针对区域或基站类别的批量改进工单。针对集成的基站动环系统硬件和软件不断优化,站点网优成为基站动环系统运维标准动作。
以较低成本实现动力运维高保障服务,是基站动环运维的目标。基于管理智能化、功能模块化的基站动环系统和智能网管,持续采用TOP N管理手段,发现并针对性改进薄弱环节,使基站动环系统配置更为精准,不断提高动力保障质量并降低保障成本。进一步推动站点向管理智能化、功能模块化方向演进,有利于将分散的基站动力环境系统打造可运营、可管理的站点网络,为未来基于站点网络的运营和发展奠定基础。