“云地协同”加速网络AI规模商用,使能自动驾驶网络

“云地协同”加速网络AI规模商用,使能自动驾驶网络

华为技术有限公司网络人工智能产品部总经理 韩雨发

AI是当今世界社会变革和产业革命的重要驱动力量,而其潜力还远未得到释放,电信产业将成为最大的AI应用市场,AI能够帮助运营商打造自动、自愈、自优和自治的自动驾驶网络(ADN),电信产业正在朝着这一目标革故鼎新。

六十多年来,人工智能产业浮浮沉沉,随着算力的提升,算法的创新和互联网积累的海量数据,未来十年人工智能技术将焕发出新的活力,成为最具有冲击力的科技发展趋势之一。

据Tractica/Ovum预测,到2025年,全球电信业对人工智能软件、硬件和服务的投资将达380亿美元,成为最大的AI应用市场。据IDC统计,63.5%的电信组织正在投资AI以改善其基础设施建设。

AI是电信网络自动化和智能化的加速器

5G是当前电信行业热点,与4G相比,5G网络在传输速率、传输时延、连接规模等关键指标上有质的飞跃,从而可以支撑更加丰富的业务场景和应用,但是也给运营商带来了新挑战。首先,电信基础网络变得越来越复杂,在很长一段时间内,5G网络将与存量的2G/3G/4G网并存,形成“四世同堂”的叠加网络。其次,随着业务的不断加速创新,2B等新业务对网络的敏捷开通、灵活性及质量等提出了更高的要求。最后,5G虽然每比特的能效比4G提升了25倍,但仍迫切需要更为精确的智能化节能技术帮助运营商提高能源效率。

AI是电信网络走向智能化和自动化的关键使能技术。将AI技术引入电信行业,可以根据已知的条件进行预测、诊断、感知和决策,帮助运营商解决预测(如基站节能)、根因分析(如网络故障识别)和优化控制(如Massive MIMO Pattern优化)等相关问题。

华为网络人工智能引擎使能自动驾驶网络

基于对电信领域的深刻理解和多年经验沉淀,华为在网络AI领域长期坚决投入,结合电信领域应用场景,推出了网络人工智能引擎。该引擎旨在结合电信领域应用场景,使能网络达到自动、自愈、自优和自治的自动驾驶网络,提升整个网络效率,降低OPEX。

“比特决定瓦特”是能源消耗的形象比喻,即网络流量大小决定能耗多少。数据分析结果显示,能耗(电费)约占网络运营费用的16%,而基站电费则占到总能耗的75%。

对此,华为推出了PowerStar基站智能节能应用,可基于NAIE的流量预测实现能耗的随需而变,以帮助运营商节约运营成本。虽然网络话务量存在明显的潮汐效应,忙时闲时能达到4倍之多,但是大部分基站设备所有资源却24小时一直打开,能耗并没有随话务量动态调整而造成浪费。因此,如何在保证网络质量的前提下,通过精准控制基站载波关断的方式降低功放能耗,就成为了基站节能的主要突破方向。

NAIE通过神经网络算法训练得到基站流量预测模型,该模型可以对未来一段时间的话务量进行精准预测,输出无线小区负载(PRB利用率)预测值。预测模型训练完成之后部署到管控单元MAE中,MAE根据PRB利用率预测结果,结合不同时段的业务类型,自动设置每个小区的载波差异化关断时长。MAE再结合KPI/KQI的实际效果,迭代优化节能控制参数,在保障网络性能的基础上实现节能效果的最大化。2019年,华为累计在30多个局点开通基站智能节能应用,节能效果最大达到16%。

图1:基站智能节能,有效降低无线网络无效能耗

在运维效率提升方面,NAIE推出的智能故障应用,可实现一故障一工单。5G建设初期,大多数运营商采取的都是与4G协同建网,随着5G建设加速,4G/5G的协同使网络变得越来越复杂。例如,一个电力故障就会导致多个部门重复派单,造成告警量大,工单准确率低等问题。

而跨界问题的定位由于需依赖跨部门的专家协作,因此难度大,效率低。华为智能故障管理通过降噪、聚合、故障分级分类三个关键步骤,可逐级进行告警数量压缩,最终将告警汇聚成根因故障。对运维排障人员而言,仅需关注汇聚之后的根因故障即可。

同时与传统的告警压缩不同,华为智能故障应用引入了AI技术,通过AI关联分析和聚类算法挖掘相关网元、线路和机房环境告警之间的依赖关系,以实现更大压缩比及更精准的告警压缩。

以某运营商为例,在现有99.8%告警压缩的基础上,通过智能故障应用进一步提升了21%的工单压缩率。按照该运营商2017年故障工单约11万张计算,20%的压缩率可减少2.2万张工单。按每工单100元成本计算,一年就可节省维护费用200万元。

图2:智能故障,实现从面向传统告警监控到面向故障运维的跨越

运营商网络的智能运维是长期有节奏的逐步实践过程,华为将与运营商一起开发实践,不断扩充应用场景、改进算法、积累经验、探索部署模式,持续提升其自动化和智能化水平。

网络AI规模部署并非坦途,NAIE让网络AI开发与应用更简单

运营商在规模部署AI应用的过程中,面临一系列困难和挑战,如数据治理难、模型开发门槛高、部署闭环难、人才转型难等。

针对电信领域的数据难题(如电信数据专业性强、数据难获取、数据准备时间长、数据标注成本高、有效样本数据少等),NAIE提供数据服务帮助运营商高效治理数据,可节省90%的数据准备时间。截至2020年8月,华为NAIE数据服务已积累22+亿条训练样本,通过专业标注工具和专家经验高价值样本标注5000多万,覆盖电信领域90%典型场景。

针对网络AI模型开发门槛高、应用难、周期长的问题,NAIE提供训练服务帮助运营商降低开发门槛,提升开发效率。训练服务内嵌华为在电信领域30多年积累的的知识和经验沉淀,内置100+电信领域资产,包括项目模板,算法、特征分析及处理SDK,可大幅降低网络AI模型的设计探索周期。

针对AI特性在部署过程中面临的模型泛化能力差、模型易老化、本地样本少等问题。NAIE提供“云地协同”架构帮助运营商规模部署AI特性,迈向自动驾驶网络。”云端”指云端AI(NAIE),包括部署在公有云、合营云及HCS的云端智能(含数据服务、训练服务、培训服务、AI市场、网络知识库等);”地端”AI包含集成在单域管控单元(MAE、NCE)和跨域管控单元(AUTIN)的网络AI,以及集成在网元设备的网元AI。

“云地协同”实现了云端、地端一起协作完成数据样本上云,模型状态管理,模型重训练,模型/知识下发、择优更新等一系列的AI模型任务,同时把云端汇集的全局网络知识经验、全量数据训练得到的高精度模型持续注入地端,使电信网络能够进行智能的迭代升级,变得越来越聪明。

图3:”云地协同”,实现AI特性规模应用

云端AI符合运营商集中化建设AI平台的思路,支持跨层、跨域、跨厂商AI能力构建,减少了运营商的重复投资。云端AI拥有强大的算力和丰富的特征样本,具备全局视野,既是运营商持续进行AI训练开发态的敏捷工具,又是网络的“知识中心”和“图书馆”。通过加持联邦学习,让分散的小样本也可以训练出高质量的模型。凭借云端仿真系统,帮助运营商更加高效安全地进行模型和业务验证。

云端提供集中化的模型监控和模型版本管理,便于AI特性快速更新,与传统软件升级相比,模型升级的效率可从月级提升到小时级。地端AI聚焦网络数据的实时采集和过滤,并实现AI能力在本地实时推理闭环。云端和地端通过云地物理通道连接,地端数据通过北向接口实时自动上传到云端,云端统一泛化训练,并作为统一的运维中心和“知识中心”,”云地协同”实现AI模型、网络知识同步更新升级,高效支撑电信网络迭代演进。云地协同可以实现“一点生效,全网复制“,即AI的特性在一个局点成功实施后,快速的形成知识和经验,在其他局点进行复制,实现在全网规模应用。

针对人才难转型难题,NAIE可提供进阶式培训服务,让用户体验从免费试用、服务体验、到购买端到端一站式服务。此外,华为丰富的线上线下课程体系及权威认证体系,可助力电信领域AI人才的转型和培育,截至日前,华为网络AI培训服务已发布初级和中级线上课程,超过3000人报名并自主学习。

与此同时,NAIE面向电信行业开放,与企业、高校、行业组织联合创新,共同促进网络AI生态繁荣。NAIE已启动百所高校合作,同时与中国电信、中国移动、中国联通、朔黄铁路在AI应用上展开深度合作、创新。通过竞赛、社区、合作的方式不断促进开发者成长进步,帮助运营商和合作伙伴汇集产业智慧获取优质AI资产,对接前沿技术,快速人才桥接。截至目前,NAIE累计用户数已经超过1.76万,在线累计训练任务接近4万个,样本累计下载量117亿,API月调用次数3.3亿次。

未来,NAIE将携手产业各界,共同打造网络AI黑土地,早日实现自动驾驶网络的终极目标。