
难题 1面向网络流量的预训练大模型技术一、技术背景5G 覆盖 eMBB、URLLC、mMTC 三大场景5G 核心网作为移动网络控制中枢需提升智能化水平适配人车物差异化连接需求。5G 核心网智能化催生网络 AI 技术应用识别、体验评估、质差分析等现有 AI 模型存在开发难度大、成本高、泛化差问题依赖高质量标注数据数据量不足、分布不均会大幅削弱模型泛化能力。预训练模型依托自监督学习从无标注样本学习可迁移参数微调适配下游任务已在 NLP、计算机视觉广泛落地。目标构建面向网络流量的预训练网络大模型统一整合各类网络 AI 任务依托海量流量训练数据提升多任务性能与泛化能力。二、技术挑战统一序列表达设计适配网络流量的 Tokenizer 与 Embedding 方案网络流量层级结构复杂包含用户、流、突发、报文、协议字段多层关联关系。高效模型架构适配网络流量的基础模型、多任务模型结构选型与设计。高效优化目标设计面向流量样本的预训练、微调任务模型充分挖掘流量样本信息实现快速、低成本学习。三、当前结果应用感知小模型TOP300 应用识别、8 大类应用独立同分布场景效果优识别准确率90%流量变化场景准确率平均下降 20%最差下降 80%重度依赖标注拨测数据泛化能力弱。体验评估小模型准确率受网络、应用行为影响大正常网络下直播 / 点播 / 短视频 3 大类 13 个 APP 清晰度、卡顿指标准确率90%弱网、拥塞场景准确率下降 20%不同应用传输协议、流量模式差异大需逐场景定制模型。面向网络流量预训练大模型暂未落地成熟方案。四、技术诉求能力要求设计适配流量数据的序列化表达、模型架构、预训练任务微调支撑 3 类下游任务TOP300 应用识别、8 大类识别、3 大类 13 个 APP 清晰度 / 卡顿评估华为自研数据集准确率≥95%。泛化性预训练模型可快速适配流量、网络状态变化对比随机森林、MLP 等传统模型同等准确率下标注数据需求降低至原 10%。参考文献[1] ET-BERT: A Contextualized Datagram Representation with Pre-training Transformers for Encrypted Traffic Classification. In WWW 2022 [2] NetGPT: Generative Pretrained Transformer for Network Traffic. In arxiv 2023难题 2高性能、适用于 NPU 硬件的 Training-free 大模型剪枝算法一、技术背景大模型参数量持续膨胀推理算力需求激增云核场景要求低成本、高性能需在端侧有限算力部署百亿参数大模型小型化剪枝是降推理成本、实现端侧部署、提升推理性能的核心突破方向。传统剪枝两大缺陷剪枝后重训练周期长达数周、成本高大模型受离群值影响精度损失显著压缩比例越高精度衰减越严重。业界方案 SparseGPT 在 GPU 效果良好但非结构化 / 2:4 半结构化剪枝思路无法在 NPU 实现推理加速310P 算力仅 70TFLOPS为 910B 的 1/4无硬件加速则无法满足云核心网极致推理诉求。剪枝后稀疏模型微调周期长、调优成本高。二、技术挑战研发可商用 NPU 侧大模型无训练剪枝算法支撑云核心网场景大模型 NPU 离线剪枝可对 Llama-2-70B 实现 30%/50% 剪枝满足两类指标剪枝 30% 参数量无需重训练多测评集平均推理精度劣化2%剪枝 50% 参数量剪枝后小时级重训练多测评集平均推理精度劣化2%。实现 30% 以上推理速度增益匹配云业务极致性能需求。三、当前结果现有 SparseGPT 剪枝方案存在两处短板NPU 原生不支持该算法迁移需改造 MindSpore、CANN 适配半结构化剪枝架构在达芬奇硬件无计算加速收益。四、技术诉求验证链路算法 / 算子方案→开源数据集MMLU、GSM8K、HumanEval、Math-500验证→华为自有数据集验证→全量数据集落地达成全部指标 1精度约束剪枝率 30% 无重训练全场景推理精度劣化0.5%剪枝率 50%推理指标劣化1%。 2性能约束剪枝后充分利用 NPU 硬件加速降低显存占用计算速度提升 30% 以上。难题 3低时延无障碍原声传译技术一、技术背景5G 核心网升级后通话网络拓展超清、AI、交互能力网侧引入 AI 无需终端升级即可提供创新业务无障碍通话为核心能力通话中 AIGC 生成对端语言音频实时传译同时保留原说话人语气、情绪、停顿、音色兼顾语义准确与自然度。整体技术链路分为三阶段原声 Encoder 网络预训练、T2A 音频生成网络预训练、A2A 原声传译微调。二、技术挑战时延约束传统分段转写 翻译链路时延极高无法实时传译需流式输出大幅压低端到端时延同时保障语义准确。数据约束A2A 原声传译数据质量标准极高大规模采集难度大仅少量样本可微调无法直接搭建端到端网络需分段构建T2A/A2T 数据依赖翻译、ASR 工具合成合成数据清洗校准难度大。三、当前结果T2A 特征注入仅完成音色克隆可行性验证语气、情绪、停顿维度未验证数据储备拥有海量无标注音频数据现有能力翻译中心具备 ASR 翻译能力但仅适配同声传译场景基线时延 1.6s、中英 BLEU23.8无障碍原声传译在时延、语音自然度存在明显短板需深度升级。四、技术诉求基础指标语义 BLEU25语音自然度 SMOS4.0端到端时延1s仅支持中英互译。挑战指标语义 BLEU35语音自然度 SMOS4.5端到端时延300ms语句语义分割精度≥98%音色 / 风格 / 韵律相似度余弦相似度0.8支持中英日韩等 20 语种。参考文献[1] https://arxiv.org/pdf/2305.17547.pdf [2] [2106.07447] HuBERT: Self-Supervised Speech Representation Learning by Masked Prediction of Hidden Units [3] https://aclanthology.org/2020.acl-main.58.pdf [4] [2006.04558] FastSpeech 2: Fast and High-Quality End-to-End Text to Speech [5] https://github.com/keonlee9420/STYLER难题 4电信网络异构 (多模态) 语料关联编码技术一、技术背景运维领域包含 KPI、信令、配置等多源数据支撑故障定位现有核心网知识、运维数据无统一编码方案无法识别数据内在关联不能联动分析故障边界无法精准界定。整体技术架构多类原始数据独立预处理后输入多模态多任务大模型结合业务知识库 Prompt 指导数据分析输出多类故障分析任务结果。数据类型覆盖时序指标 Perf、告警序列 Alarm、运行日志 Debuglog、半结构化信令 MML、信令序列 CHR、产品文档、3GPP 协议文档、网络流量时序数据分别适配运维 / 网络大模型。二、技术挑战多模态数据种类繁杂预处理难度高网络拓扑、设备配置、VoNR/VoLTE 业务知识等非结构化语料缺少统一编码技术。多模态数据强关联、存在因果依赖需要融合知识与数据混合编码实现知识、数据精准关联对齐。三、当前结果仅信令数据实现流程 - 消息 - 信元三层编码MML、KPI 等其余单模态数据无成熟编码方案无法开展多源运维数据联动分析、异常识别。四、技术诉求研发异构多模态数据关联编码技术实现多模态数据语义对齐、复杂故障边界判定基于华为自有数据集异常识别准确率≥99%覆盖两类异常数据表征异常指标零值、突增突降关联关系异常会话数远小于用户数等链路异常。难题 5三方 CaaS 下 CloudOS 存储 Bypass 关键技术一、技术背景存储 Bypass 定义后端存储故障时虚拟机及业务可稳定运行一段周期平台层最长 24h网元层最长 4h实时检测存储状态故障时业务、最小维护通道与存储解耦持续运行。原生 CloudOS 缺陷虚拟机场景强依赖远端存储底层存储故障会导致上层容器卡死、业务中断现有定制化内存启动方案可实现存储解耦但存在侵入式修改 CloudOS 的缺陷。架构说明虚拟机分为华为自有业务容器、第三方平台容器底层依赖 HOSTOS、OpenStack、Qemu/KVM数据持久化依托远端 SAN / 分布式存储本地磁盘仅做辅助。二、技术挑战原生三方 CaaS CloudOS容器 OSK8s Agents 容器引擎存储耦合度高原生不具备故障 Bypass 能力。云原生三层解耦发布架构虚拟机 CloudOS 由第三方提供不支持侵入式底层修改。三、当前结果远端存储故障场景虚拟机 CloudOS 存在卡死现象上层容器重启复位业务无法平稳运行主流 CaaS 平台无存储 Bypass 能力仅华为电信云平台具备该能力。存储故障恢复后容器访问远端存储权限异常只读无法切换读写业务无法恢复。现有可行方案将 CloudOS 关键配置文件内存化长期方案推动开源社区原生支持内存化。四、技术诉求虚拟机场景非侵入式上层插件技术解除运行时存储依赖存储故障时CloudOS 全组件容器 OS、K8s Agents、容器引擎稳定运行规避上层容器复位指标约束组件兼容适配 RHCOS、Photon OS、SUSE 等通用 CloudOS性能损耗整体虚拟机性能劣化不超过 5%故障约束存储故障场景K8s Agents、容器引擎惯性运行上层容器无复位存储故障恢复后容器不重启持续读写访问。整体补充说明全 5 道难题覆盖云核心网 AI 大模型、NPU 硬件加速、实时语音 AIGC、电信运维多模态编码、云平台存储高可用五大技术方向每条完整保留技术背景、核心挑战、当前落地瓶颈、量化技术指标、参考文献如有剔除全部对接专家、出题组织、联系方式、浏览互动数据、页面 UI 信息所有量化精度、时延、算力、性能、时长、准确率指标完整保留无删减。