1
1
2 边缘技术演进与发展白皮书
前言
伴随着云计算、5G、物联网等技术快速发展,边缘计算备受关注,正在加
速迈向广泛普及和深度应用的新阶段。边缘云在更靠近用户和数据源头侧部
署,拓展中心云计算服务边界,满足用户在低时延、成本控制、敏捷部署、
数据安全等方面业务需求。自2018年《边缘云计算技术及标准化白皮书》正
式发布以来,边缘云计算概念定义逐渐明晰,技术架构持续演进,实践场景
不断丰富。
为进一步推动边缘云技术深化发展,本白皮书以《边缘云技术演进与发展白
皮书》为题,旨在深入探讨边缘云在技术架构、应用场景、标准布局等方面
演进与发展,为边缘云计算下一阶段发展提供新动能。
3
编写单位(排名不分先后) 参编人员
阿里云计算有限公司
中国信息通信研究院(云计算与大数据研究所)
任庚 杨敬宇 郝冲 李克 张毅萍 刘廷伟
白常明 王广芳 熊鹰 李晓成 高顺路 肖文鹏
杜凯 张振尧 佘俊泉 郭辉平 刘阳阳
栗蔚 徐恩庆 董恩然 李昂 王蕴婷
4 边缘技术演进与发展白皮书
前 言
二、边缘云节点小型化技术演进
三、边缘云节点硬件基础设施技术演进
四、边缘云节点网络架构技术演进
五、边缘云分布式云管系统技术演进
六、边缘云典型应用场景
七、边缘云技术发展展望
一、边缘云计算发展概述
目录
01 边缘云硬件初期阶段:无定制化
02 边缘云硬件当前阶段:轻度定制
03 边缘云硬件未来演进方向:面向场景深度
定制
01 边缘云统一网络架构的发展趋势
02 网络架构演进
1.第一阶段:经典网络
2.第二阶段:混合网络
3.第三阶段:超融合网络
01 分布式云管架构演进
1.云管第一阶段:基本功能
2.云管第二阶段:融合管控
3.云管第三阶段:多态混跑
4.云管第四阶段:生态支撑
02 多维协同
1.边边协同
2.云边协同
03 边缘节点装配
01 边缘云应用场景发展趋势
02 流量型场景
03 终端云化场景
04 政企边缘云场景
1.商用边缘云
2.自用边缘云
01 节点小型化边缘云定义
02 节点小型化边缘云技术能力评估指标
03 节点小型化“一云多态”技术发展路线
04 节点小型化边缘云发展趋势
5
6 边缘技术演进与发展白皮书 边缘云计算发展概述
Development
随着过去十年间全球云计算市场的指数级增长,云计算技术突飞猛进,市场快速扩张。集中式
的云计算架构,提供了基于数据中心的大规模计算、网络和存储等资源,解决了泛互联网行业
在前二十年快速发展所面临的业务迅速增长、流量快速扩张、大规模计算需求等问题。
5G、人工智能、物联网等技术的规模化应用和企业数字化转型快速推进,云计算应用从互联网
行业向政务、金融、工业、医疗等传统行业加速渗透,集中式云计算模式逐步难以满足部分业
务场景在网络时延、带宽成本、数据安全、敏捷部署等方面需求,用户对云计算服务能力要求
逐步多元化发展,边缘云计算模式应运而生。
边缘云计算是构筑在边缘基础设施之上,位于尽可能靠近事务和数据源头的网络边缘侧位置,
并能够与中心云协作的云计算模式。相较于集中式云计算,边缘云可提供弹性扩展的云服务能
力,具有快速响应时间、低延迟和轻量计算等特点。
根据IDC《中国边缘云市场解读,2022》报告数据,2021年中国边缘云市场规模总计达50.4亿元
人民币,其中边缘公有云服务市场占比较大,市场规模达25.6亿元人民币。IDC表示边缘云在互联
网视频、游戏、安防、交通、文旅等多个行业均有落地实践,预计未来市场增长空间广阔。
围绕用户时延、网络位置等多种因素,边缘云部署形态可分为云服务延伸边缘云、电信网络边
缘云、现场边缘云等。
云服务延伸边缘云。此类边缘云部署模式提供针对特定区域或是广域覆盖边缘云资源,包括
边缘公有云、CDN边缘云等类型。其中,边缘公有云是依托大规模、分布式的云节点、成熟
的软硬件技术以及远程自动化装配维和运维保障体系,为用户提供标准的边缘云接入和云服
务;CDN边缘云是从CDN服务扩展而来的边缘云计算模式,依托CDN广泛分布的硬件基础设
施,通过对其虚拟化改造,以提供边缘计算服务。由于规模大、覆盖范围广等特点,此类边
缘云计算服务具有相当的成本和高可用性等优势。
01 在用户需求方面
02 在概念定义方面
03 在市场数据方面
04 在部署模式方面
1
7
t overview
边缘云为各行业的企业带来全新的价值提升。在延迟敏感场景中,例如RTC、直播等业务过去部署在中心云的业务开始走向
分布式下沉路线,逐渐部署到边缘云节点上,满足低延迟需求;在带宽流量压力场景中,通过部署边缘云将网络流量下沉到
本地数据中心,将大大缓解骨干网压力,为企业节省核心网络开支,同时实现就近接入,用提升户体验;在数据安全场景
中,边缘云可以通过部署在用户本地的形式提供定制化服务,将数据进行本地贮存,满足数据监管合规要求。
随着数字经济发展逐渐成熟和智能化转型的深入,边缘云计算需求会持续增长,在未来几年边缘云计算的机会也会大幅增加。
从云到边再到物联网终端设备,边缘云上承中心云的负载延伸,下接海量终端设备的接入管理,边缘计算作为中间层,是实
现云边端一体化发展不可缺少的一环,可以预见未来边缘云计算的边界和应用场景依然会持续快速扩张。
电信网络边缘云。此类边缘云利用运营商网络边缘接入点,根据需求建设资源池规模、服务种类差异化网络边缘服务,
包括 5G MEC等。MEC边缘云是基于通信网络构建的边缘云平台,能够与5G等网络融合。MEC作为边缘云计算平台承载
各类算力业务的同时,也可使用5G网络中就近转发、开放、网络切片等特定的网络能力,在低时延、云网融合等方面
具有天然的技术优势,MEC云可实现公有云或混合云等不同形式的交付。
现场侧边缘云。此类边缘云更靠近用户数据中心或业务现场,实现按需部署,包括混合边缘云、专有边缘云等类型。现
场侧边缘云可通过专有交付形式建设在用户本地数据中心,提供低时延、定制化云服务。混合边缘云是指专有云和公有
云相结合提供服务,组成混合云模式的边缘云,为业务应用提供更高的灵活性的同时,满足监管对数据本地贮存的要
求。现场边缘云主要面向生产现场,可实现大量终端设备的连接、生命周期管理和轻量化应用的运行,将现场IoT设备
连接到本地边缘云平台,在弱网情况下实现边-端侧适度自治。
05 在实践场景方面
2
3
8 边缘技术演进与发展白皮书
9
边缘云节点小型化技术演进
01 节点小型化边缘云定义
近几年来,边缘云服务商经历了在各行业和边缘场景的探索与实践,产品与方案正在加速完成商业
化落地。在云服务商、电信运营商、 CDN服务商、独立边缘计算服务商、边缘软件提供商和最终
用户的共同努力下,边缘云商业化案例的数量和规模持续大幅上升。边缘计算用户已接受部分业务
在边缘云的应用实践,并部署了相关产品与服务,在此类业务场景实践过程中,边缘云演进出来独
特的小型化平台和技术方案。
边缘云分布广泛、部署轻量,这正是边缘云的优势所在,而随着边缘云市场发展,边缘云节点模式
逐渐向小型化发展。节点小型化边缘云是基于大规模地域分散的边缘节点相互协同组成的一朵可远
程管控、安全可信、标准易用的分布式云。小型化的定义,既包括了单一边缘云节点,也包括了若
干个边缘云节点组成的逻辑小集群。多种云算力形态(一云多态)可以在单一边缘云节点中提供,
也可以通过节点小集群来提供。
图1 节点小型化边缘云
10 边缘技术演进与发展白皮书
节点小型化边缘云有如下技术特点:
安全可信
交付效率指标
远程管控
边缘云节点分布式部署在各地,是非中心化的,可通过互联网或专线等方式实现网络互联互
通,按照统一的管控标准对分布在各靠近终端的边缘云小型节点进行管理。同时,在弱网情
况下,边缘侧节点可进行适度自治管理。边缘云管控的部署位置可在中心云节点,也可以在
边缘云节点。
资源覆盖指标
边缘云是由分散的小节点构成的分布式云,节点的覆盖范围和数量决定了客户访问互联网服
务时的体验。具备较低的网络延迟,才能够满足低延时场景的需求,因此,对于小型边缘
云,节点的覆盖范围以及节点的数量是衡量小型边缘云服务质量的关键指标,通常在每个省
份的电信运营商机房都需要有节点部署,才足够做到提供本地化服务。
标准易用
边缘云节点是“一云多态”的技术服务形式,也是具有大规模分布式部署的节点,边缘业务
有很多是从中心云下沉部署到边缘的,所以,需要边缘云提供的云资源,包括算力、网络、
存储等具有与传统云服务高度一致的使用规则和体验。可以通过提供标准API,标准云产品
等能力为客户提供开放、标准、易用的使用体验。
云边协同指标
小型边缘云不是单节点技术,而是将遍布各地的小节点统筹管理、统一调度的技术。在控制
面和数据面上需要高性能、稳定的数据传输能力,比如操控指令需要快速下发到所有节点实
并时生效,分散的节点上的监控和业务数据也需要能够快速的回传至中心进行进一步处理。
因此在中心节点和边缘小节点间需要具备高性能、安全可靠的指令和数据传输通道。
边缘云节点提供的是边缘云服务,也需要满足云计算所需的安全和可信的要求,需要满足机房、
机架和硬件层面的安全要求,同时需要满足在操作系统、云管、云产品等软件层面提供安全能
力,数据加解密、等保等安全要求。对边缘云节点或集群,可以具备数据迁移等能力,保证数
据存储的安全和可靠性等要求,也可以通过边缘云节点与中心管控间的交互和数据传输等协同
方式,对节点的数据进行备份和恢复。除了软件层面的安全可信保障外,还可以通过添加安全网
关、防火墙、防DDos攻击等硬件安全保障方案,共同完成边缘云节点的网络安全保障。
云服务的基础设施需要具备一定的自动化响应能力,物理硬件上架和网络连线施工两项工作
强依赖人力介入,但云平台的部署和云资源的开通则应做到自动实时响应。特别是小型边缘
云场景,通常用户的业务更加灵活多变,需要平台能够开通不同规格的计算和存储服务,对
于云平台而言,灵活交付能力尤为重要。
02 节点小型化边缘云技术能力评估指标
基于边缘业务场景的需求,小型化边缘云应当在以下指标中有突出表现:
1
11
第二阶段,边缘裸机、裸金属服务
第二,应用部署标态化
第一阶段,边缘虚拟机服务
该阶段是边缘云发展的初期阶段,主要以分布式的数据采集和本地化服务为主。用户对于边
缘侧的主要需求是具备分布式的计算能力。由于中心云计算已经形成了虚拟机的使用习惯,
边缘侧沿用了该模式,主要技术栈依然是基于Linux系统的虚拟化技术,提供标准的虚拟机
服务。
第一,资源位置无感
随着边缘云技术的发展,分布式的资源加上微服务化部署、以及智能的调度技术,使得用户
能够在任意位置直接使用服务,而不用再关心背后的资源部署位置,这也是云原生技术发展
的必然结果。
第三阶段,边缘容器服务
随着容器技术的流行,传统的开发和运维模式产生了巨大的变化,以容器和容器镜像为代
表,资源和发布方式出现了革命性演进。计算资源需要提供容器实例,以及对应托管服务。
相比于中心云,在边缘侧生产和管理容器在技术上存在更多挑战。首先,由于边缘侧资源的
分布性,多节点管理需要跨互联网进行;其次,为提供体验一致的K8s服务,边缘云平台需
要实现分层的分布式管理和跨公网的可靠性保障。
第三,云边一体化服务
边缘侧能力持续增强,可提供的云服务越来越多,使用体验愈发向中心云靠拢,业务在中心
云和边缘云可以实现快速迁移。除此之外,边缘云平台也需要通过大量的云边协作,来实现
性能、成本、安全、稳定性等方面的最佳方案。
第四阶段,边缘Serverless服务
直到前三个阶段都仅是资源形态层面的演进,第四阶段则是使用模式的升级,边缘云平台面
临的挑战更为严峻。随着微服务化的出现和成熟,用户期待边缘云能够直接提供服务,通过
接口调用便可使用资源,真正做到按需使用、按量计费。
随着边缘业务场景丰富,用户对于边缘计算的规格和性能要求越来越高,传统的虚拟机模式
逐渐无法满足,因此边缘云技术开始往多样化、异构化发展。任何计算设备都可以托管在边
缘云平台,直接提供裸机作为业务载体,节省虚拟化的资源开销,尽可能的将服务器的最大
性能提供用户。对于这个阶段的边缘云技术,则需要实现一套管控模型,使之能够生产虚拟
机之外的裸机和裸金属实例。
边缘云平台倾向提供标准化的服务,应用使用资源的模式和发布方式也会产生相应变化,不
再是单台或批量方式的资源申请和部署,而是通过标准的资源弹性描述和不可变镜像来进行
应用交付,减少环境依赖和升级的复杂性。
03 节点小型化“一云多态”技术发展路线
04 节点小型化边缘云发展趋势
边缘云节点中,提供多种云算力形态即“一云多态”,将成为小型化边缘云节点技术趋势。随随着边缘场
景逐渐丰富和边缘技术融合化发展,边缘云节点需要同时提供虚拟机服务、容器服务、裸机服务和裸金属
服务等算力形态一云多态的技术形式也会随着云计算技术的发展而长期存在。
12 边缘技术演进与发展白皮书
13
边缘云节点硬件基础设施
技术演进
边缘云基础设施,主要包括机柜、路由器、交换机、服务器等各类硬件设备和光缆、电缆等连接介
质组成,各硬件物理设备按照建设方案,分布在机房对应机柜的不同位置,设备之间通过光缆相互
连通,形成边缘云节点的硬件底座。
基础设施中最核心的部分是硬件设备,通过对不同物理硬件设备定义和设计,组合出来可以提供不
同的节点能力。根据硬件不同的能力和用途,组合成机型能力也不同:
计算型设备
网络型设备
存储型设备
融合型设备
主要特点是CPU主频高、核心数多,磁盘存储容
量较小,主要面向数据计算场景;异构计算场
景,通常搭配GPU、各类编解码卡等部件,以
视频的编解码、渲染等为主要应用场景;裸金属
场景,可搭配智能网卡,提供与传统物理机无差
别的计算能力;
主要特点是网络带宽吞吐高,交换场景,各类
交换机和路由器设备,作为基础网络接入、
汇聚和交换设备使用;利用高性能网卡,提供
LB、EIP、NAT等云上网络服务能力;
主要特点是CPU主频低、核心数少,磁盘存储容量较
大,SSD搭配HDD或者全SSD,以数据存储或者分布
式存储服务为主要应用场景;
主要特点是能力平衡,单台设备可具备计算与存储融
合、计算与网络融合能力。计算与存储融合型:CPU
主频高、核心数多,磁盘存储容量较大,一般是SSD
搭配HDD或者全SSD,可同时提供较强的数据计算和
存储服务;计算与网络融合型:CPU主频高、核心数
多,磁盘存储容量较小,网络吞吐处理能力较强,可
支持交换、网络虚拟化、负载均衡、安全能力。
图2 边缘云节点硬件组成
14 边缘技术演进与发展白皮书
01 边缘云硬件初期阶段:无定制化
02 边缘云硬件当前阶段:轻度定制
本阶段主要服务于流量型应用场景,例如,直播、点播、转码等业务。复用CDN的资源池和硬件底
座,以网络型、通用计算型和存储型设备为主。
其中网络型设备采用通用交换机或路由器,计算型设备以直播、转码场景为主,存储型设备主要是
支持点播场景或者云盘为主,计算和存储型的硬件主要是x86架构的服务器,跟随中心云服务器选
型,无定制化。
其中网络型设备采用通用交换机或路由器,计算型设备以直播、转码场景为主,存储型设备主要是
支持点播场景或者云盘为主,计算和存储型的硬件主要是x86架构的服务器,跟随中心云服务器选
型,无定制化。当前阶段主要采用超融合硬件和异构硬件的组合方案,可以进行轻量化定制,支持
快速部署,用户快速接入。
面向边缘云场景的自研定制化超融合网关应运而生,可编程ASIC中灵活加入了交换机、virtual
Switch和网关的Offload,FPGA对VPN、TLS进行进一步卸载,在强大的x86平台内,进行有状态网
元和安全、管控的部署。超融合设备不仅可以作为边缘云的底座,提供T级LB、T级网关的裸金属接入
能力,还可以通过二层交换机扩展。
面向边缘云场景的定制化异构服务器是针对于终端云化的云游戏、云应用场景研发的。首次在边缘云
引入ARM阵列和PC阵列,通过对阵列服务器的硬件规格和软件能力的定制化,实现了多厂商软硬件
标准的统一,满足云的快速部署、远程管理和运维需求。异构服务器采用高密的设计方案,可同时提
供多种计算形态,游戏和应用兼容性较高,也可以兼容公共云IaaS组件,提供一致性用户体验。
图3 超融合硬件架构图
15
03 边缘云硬件未来演进方向:面向场景深度定制
边缘云发展至今,基础设施容量和性能大为提升,除了使用服务商提供的边缘云服务外,用户还会
选择基于边缘云基础设施部署自身业务,这对边缘云的基础设施能提出了更多的需求,同时也对于
计算、存储、网络、安全等方面的性能提出了更高要求。例如,用户希望在边缘侧拥有接近物理机
的计算性能,用于部署自己的服务,甚至是自行搭建计算、存储、网络服务。边缘云未来发展会向
着深度定制方向演进,实现面向应用场景的硬件体系建设,例如,面向高性能场景的裸金属硬件设
备定制,面向终端云化场景的高性能设备定制,面向大流量场景的网络设备定制等。同时,基于相
同的硬件底座,通过部署不同的软件,也可以支持不同的计算、网络、存储能力,满足不同业务场
景的需求。
图4 边缘云硬件演进图
16 边缘技术演进与发展白皮书
17
边缘云节点网络架构技术
演进
01 边缘云统一网络架构的发展趋势
02 边缘云节点网络架构演进
边缘云网络是随边缘云行业发展而迭代更新的,随着边缘云的部署规模不断扩大,边缘云节点持续
扩容,业务和场景越来越丰富,边缘网络也不断面临新挑战,业务驱动边缘网络架构持续优化升
级。
边缘云发展初期,云平台上承载单一用户,边缘网络只需要满足单一用户的组网需求即可。随着用
户增多、边缘云场景逐渐丰富,边缘云承载的业务也逐渐从单一用户和单一场景,发展到单一用户
和多种场景,再到当前的多个用户和多类场景。
边缘网络为了适应新的服务形态,需要发展为统一的网络架构。不同的网络架构共存会极大增加边
缘组网的复杂度,并随着边缘云规模增大而愈加复杂,增加建设和维护成本,所以,边缘云统一的
网络架构成为必然的发展趋势。
边缘云发展初期,为应对企业用户重资产向轻资产转型的趋势,边缘云服务商需要建设分布全国的
小型化边缘云节点,并提供帮客户将业务平滑迁移到边缘云的配套迁移服务。该场景对边缘云普遍
有下面几个核心诉求:
业务从传统数据中心到边缘
云能够平滑迁移,不需要进
行业务系统的改造和兼容;
大带宽实例,对网络
IO吞吐能力要求高;
成本强敏感,要求相
对客户IDC托管有成
本优势。
1 第一阶段:经典网络
18 边缘技术演进与发展白皮书
边缘云单节点规模小,大部分节点服务器规模
在3~40台,对应带宽规模达10~200G,若按
VPC网络架构建设,需要额外引入多台服务器
作为软件网关,导致成本上升;
VPC的灵活组网能力在大带宽业务场景中并不是
核心诉求,且VPC负载均衡不支持CDN系统中依
赖的LVS DR模式(需要二层网络),客户现有业
务迁移至边缘云需要对系统进行大量适配改造。
因此,VPC虽然在中心云网络中有非常成熟的使用背景,但在边缘云中并不适合引入。而经典网络
架构在边缘场景中应用,能够支撑客户大带宽业务从传统IDC到边缘云的快速迁移,同时保证非业
务设备占比低,实现综合成本低。
考虑到系统扩展性,在硬件网络架构设计时,仍然保留了未来扩展到VPC网络的能力。
当时公有云网络已经从经典网络全面升级到VPC网络,VPC通过各种网络增值组件大幅提升了中心
云上的网络灵活性和功能丰富度,让各种类型的业务场景可以享受网络云化带来的高度便捷性。因
此,在边缘云初期的网络架构设计中,首先考虑沿用VPC网络架构。但结合客户大带宽业务场景对
边缘云的核心诉求,将VPC网络与经典网络进行技术对比,发现VPC网络的引入并不能有效满足客
户诉求,主要原因有以下两点:
图5 VPC网络和经典网络架构对比
19
经典网络架构快速支持大带宽业务成功实践后,用户开始逐步迁移更多业务场景到边缘云,经典网
络在功能丰富度、灵活性方面的缺失也逐渐成为用户新痛点,对VPC能力的诉求再次提上日程。
在边缘云第二阶段网络架构规划中,引入VPC成为必选项,但原有的大带宽业务对性能、功能和成
本的核心诉求仍需要兼顾。最终架构设计为在网络虚拟化方案上将经典网络架构下网卡直通(SRIOV)方案与VPC架构下虚拟交换机(VS)方案共用服务器混合部署,如下图所示:
混合网络架构,能够兼顾大带宽场景的低成本诉求和其它场景的功能多样性诉求,但两套网络架
构给整个边缘云系统带来了极高的复杂度,对边缘云的继续扩展和维护带来巨大挑战。近年来,
可编程硬件在云计算领域大规模使用,边缘云网络架构也随之进一步升级,进入软硬超融合一体
化阶段。
可编程硬件的规模化落地,将VPC网络架构中原来需要独立部署在x86服务器上的各种网元组件和
宿主机上的虚拟交换机能力全部卸载到硬件设备上,节省服务器资源的同时,大幅度提升VPC网
络的吞吐性能,至此,早期边缘云不能全面使用VPC网络架构的约束全部解除。
针对大带宽业务延续使用原有经典网络方案,对其它类型业务提供VPC网络方案,同时,也可以在
同一个边缘虚拟机实例上提供两块虚拟网卡,分别支持经典网络和VPC网络。混合网络成为边缘云
所特有的网络架构方案。
第二阶段:混合网络
第三阶段:超融合网络
图6 VPC网络与经典网络混部模式
2
3
20 边缘技术演进与发展白皮书
图7 边缘超融合网络架构
21
得益于可编程硬件在网络处理性能上的绝对优势,软硬一体化边缘云网络不仅能够解决VPC网络
的性能和成本问题,还能够承担起网络攻击的监测和处置工作。对于小型化边缘云节点,可编程
硬件网络设备是不可多得的利器。
NETWORK
22 边缘技术演进与发展白皮书
23
边缘云分布式云管系统技
术演进
01 分布式云管架构演进
从技术演进来看,边缘云分布式管控系统是一对多的分级管控模型,即一个统一的中心管控和多个
边缘管控。中心管控和边缘管控需要协同完成管控逻辑,各级管控平台需具备满足自身定位的管
控能力。另外,中心管控需要适配边缘管控,而边缘管控需要适度自治能力。
初期边缘云的云管平台仅为满足业务而搭建,能够覆盖的场景单一,提供的仅仅是边缘虚拟机服
务和配套的边缘块存储服务。设计架构是一中心管控加多边缘管控模式,中心云需要管控边缘
能力,边缘适度自治,网络架构使用的是直通+underlay方案。其中,中心管控包含以下服务模
块:
边缘管控包含以下服务:
云管第一阶段:基本功能
核心管控服务
库存调度服务
监控报警服务
API服务
运维服务
负责实例的生产管控等管理逻辑
负责资源的调度分发、库存管理等管理逻辑
数据及业务的监控报警服务
承载客户各类交互
硬软件的运维管控
计量计费服务 装配管控服务
边缘管控服务
将客户的各类资源进行计费结算,如实例带宽、
实例规则、云盘等
资源的安装、配置初始化管控
负责边缘计算、存储、网络虚拟化的管理
图8 极简管控架构
1
24 边缘技术演进与发展白皮书
随着业务场景愈发复杂,第二阶段的云管平台在资源形态、硬件类型、产品形态等方面都有了极
大的改变,边缘侧管控模型更加复杂,架构也进行了优化升级。
在中心管控,为了应对日益复杂化的硬件类型的统一管理,增加了装配管控服务,实现对各种类型
的硬件资源自动化纳管到库存系统,并在库存调度中增加了对融合资源的数据模型支撑,具备对
融合产品形态的逻辑抽象能力,相比于第一阶段,中心管控增加如下服务模块:
在边缘管控,服务架构进行了升级,分模块协同完成管控工作。首先,统一一个入口对接中心管
控;其次,针对计算、存储、网络分别设计了各自的管控服务,同时,在计算、存储、网络各自
的管控服务中,可以针对融合的资源形态,向上提供统一的管控模型。第二阶段边缘管控主要具
备以下功能:
云管第二阶段:融合管控
装配管控
计算管控
网络管控
存储管控
融合资源的自动化安装、配置初始化服务
融合计算资源的管控,可提供虚机、裸机、裸金
属、容器等形态各异计算服务
融合网络组件,可提供VPC、ELB、NAT等云上网
络能力
融合存储资源,单一集群可提供块存储、文件存
储、对象存储等各类存储服务
图9 融合管控架构
2
25
随着云原生概念深入人心,容器化逐渐成为主流,更多应用的落地形态基于云原生技术,催生出云
管控架构的再一次升级。相对于前一阶段的云管平台,第三阶段的云管平台构建出PaaS边缘容器
平台,实现边缘多种虚拟化服务混跑模式。
在中心管控,发展出一套PaaS容器云平台,构筑在IaaS产品上。基于K8s的生态,可独立提供出各
种类型的容器服务,包括但不限于原生K8s能力、容器应用服务、Serverless容器服务等。
在边缘管控,容器服务也需要跟原有的计算、存储、网络管控架构融合并紧密协同,利用K8s对异
构资源的支撑能力,CSI、CNI体系等,提供边缘容器服务。
依托第三阶段云管平台完成的边缘IaaS和PaaS基础设施搭建,更多的云产品得以下沉到边缘。一
方面源于云计算配套服务驱动,例如,数据库、中间件是云计算和云原生的基础组件;另一方面,
业务场景也催化管控架构的演进,支撑更多云上服务下沉到边缘。
在中心管控,边缘产品平台,向上透出产品的服务界面,向内透出运维界面,向下跟边缘产品管控
对接,打通到真正的产品实现层。
在边缘管控,基于功能解耦,将边缘产品域标准化为管控域、服务域和运维域,云产品按此将自身
能力对接释放:
云管第三阶段:多态混跑
4 云管第四阶段:生态支撑
图10 混跑融合管控架构
管控域
运维域
服务域
边缘产品的管控能力层,负责边缘产品的生命周
期管理
边缘产品的管控能力层,负责版本管理、故障管
理等功能
边缘产品对外交付能力层,对客服务的切面
3
26 边缘技术演进与发展白皮书
图11 融合平台管控架构
02 多维协同
边缘云协同大体可分为“边边协同”和“云边协同”两类。边边协同,主要是面向边缘云节点集群
间的计算、网络和存储等技术的资源协同。云边协同,主要是面向边缘云管控与边缘云节点集群间
的管控协同。
边边协同技术,主要包括协同计算、协同网络和协同存储。边缘云节点规模通常较小,资源规格受
限,不将资源部署的物理位置作为交付属性,而是按网络时延和服务质量等评估指标来交付资源,
这就要求边缘节点资源能够被管控系统“统管统调”。节点资源通过边边资源协调,实现“资源
池”化,边缘云资源池是资源管控的基础。
边缘云节点提供的是小型云的算网存资源,且算网存资源使用水位相互依赖,从技术上看,单一节
点或单一集群里的资源容易跑满、造成同节点的其他资源无法再分配,边缘云边边协同管控需要能
够在边缘云节点和集群间进行多维资源的协同调度,调度策略的执行也正是基于边边资源协同来实
现的。
从业务高质量和资源高可用角度看,通过边边协同可以实现边缘云的高可用性保证。通过边缘云单
节点或单集群内软硬件多路互备的技术方案实现系统高可用研发成本较高且效果未经验证,而依托
分布式云管的多级协同、边边协同和多点协同实现高可用,可以提供更高的性价比实现高可用,即
单点不可用时,由其他节点或集群来补位。
以边缘云的“协同存储”技术方案为例,阐述边边资源协同的技术实现。
协同存储管控的核心设计包括云边协同管控、全网智能调度、边缘自治管控等,是边缘云云边协同
以及跨节点协同的重要组成。
用户在使用对象存储时,针对海量数据,提出了大流量、就近、低延迟的要求,边缘云在这些方面
具备天然优势。但边缘云的对象存储在使用方式和体验上存在明显不足。边缘云由很多分布式边缘
云节点组成,如果每个边缘云节点独立进行对象存储服务,用户使用时将面临节点资源管理、资源
读写调度、单节点可用性运维等诸多复杂问题。
边边协同
1
27
图12 分布式存储示意图
边缘计算提供了位置无感的协同存储服务,通过中心管控和多个边缘节点进行协同,将分布在各地
的边缘节点的物理存储资源,组成一个逻辑统一的对象存储资源池。用户不需关心读写位置和单节
点可用性带来的运维和调度问题,即可得到与使用公有云对象存储一致的接口体验,以及由于数量
众多的边缘存储资源整合而带来的大容量、高弹性的存储资源池。
图13 位置无感的分布式存储
28 边缘技术演进与发展白皮书
协同存储的云边协同管控、全网智能调度、边缘自治管控等,是边缘云边边协同以及跨节点协同的
经典案例。
图14 协同存储管控架构
协同存储核心包含中心管控与边缘节点两部分,其中,中心管控包含以下管理模块:
边缘节点包含以下管理模块:
元数据管理
节点网关
读写调度
存储引擎
资源调度
边缘管控
多点数据协同
汇聚全网的元数据进行统一管理,与文件读写调
度、文件生命周期等联动;
提供节点文件读写服务,如存储协议兼容、http/
https访问支持、动态配置、跨域管理、流控、日
志监控等。
根据用户地理位置、所需资源量、文件分布等因
素进行全局文件读写调度;
提供基础的存储能力(文件读写等)以及文件容灾能
力(EC、三副本等)。
负责逻辑存储桶与物理存储桶的影射关系管理,
根据节点状态、水位进行全局资源动态规划;
与中心管控协同完成完整的管控逻辑,同时在
节点范围内具备一定的边缘自治能力;
负责节点内存储管理、跨节点数据复制/迁移等
操作;
负责节点内多引擎容灾。
对节点数据进行跨节点复制或数据迁移,提高整
体服务可用性;
29
云边协同通道,可以看做是边缘云计算场景下的消息中间件,它主要解决边缘云计算过程中的中
心云-边缘云节点间的管控信令通信问题。相比传统中心云,边缘云计算作为一种分布式系统,其
节点间的信息交互不再局限于单一机房、单一城市或者有限的若干城市,而是需要在全球范围内具
备可靠的消息通信链路,这条链路很难直接使用互联网IP,原因如下:
第一,场景受限。不是所有的场景都是边缘云主动请求到中心的,今天在边缘云管控系统中,中心
会有大量的管控请求主动请求到边缘,单一场景远不能满足业务诉求。
第二,安全受限。边缘云节点是依托ISP网络之上的,由于ACL,安全管控策略等原因,在边缘云
节点内一直遵守着只出不入的原则,确保节点在物理上不会被外部网络直接访问,保证一定的安全
性。
第三,资源/运维受限。在IPv4资源越来越紧张的今天,若按每个业务都申请分配VIP-Server,在
资源上无法满足未来的需求,另一方面,运维成本也相当大,耗费人力和物力,造成重复建设与资
源浪费。
云边协同
边缘云系统中的云边协同通道应具备以下能力:
协同管控,相较于传统数据中心的管控方案,边缘云管控平台需要管理更大规模的分布式边缘云节
点。中心云管与边缘云节点间的连接通常是基于不可靠的互联网链路建立的,在此物理环境下,
为了应对日益扩大的边缘云节点资源规模的需求、支持边缘云业务在断网、弱网状态下可持续运
行,“云边协同管控”和“边缘云节点有限自治”方案就成为了管控技术发展的必然选择。
类似传统消息中间件,解耦消息生产者和消费者,实现系统间的异步调用;
提供高可用性和稳定性的保障,具备一定的异常处理能力。全球范围内的网络链路是不可靠
的,云边协同通道需要在不可靠的物理信道中构建可靠的信息通路,统一解决分布式通信的疑
难问题;
解决数据安全问题,提供统一的ACL模型,对消息的各个参与方进行身份验证和数据权限,精确
控制每个端的安全策略;
管理消息收发管控策略,根据业务优先级设置不同的消息QOS,保障重要业务的消息可达率。
2
30 边缘技术演进与发展白皮书
管理节点数量多,资源规模大。随着边缘云节点数量持续增加,如何有效应对资源规模化增长带来
的中心管控压力,成为了中心管控亟待解决的问题。
将部分管控能力下沉至边缘,收敛云边交互,降低回传到云的数据压力,可以有效降低因节点数量
增加给中心管控带来的并发压力。
云边弱网,连接不可靠。在云边管控通道不稳定时,边缘节点依然需要持续提供服务,如何解决云
边失联情况下数据一致性的问题是第二个技术难点。
通过引入边边网络加速能力,建立云边协同的数据服务系统,既提升了性能,降低了互联网带宽成
本,又能确保服务的高可靠性。
带宽成本高,分发效率低。如何快速分发系统镜像到边缘节点并支持大规模并发,以同时提升数据
分发和业务创建效率,也是云边协同重点要解决的问题。
中心和边缘两级管控架构中,增加云边状态感知能力:在云边失联时,边缘云节点进入自治状态,
边缘业务可持续运行;当云边连接恢复时,边缘云节点能够退出自治状态,并与中心同步,保持数
据一致性。
云边协同管控的主要挑战在于如下:
为了解决上述问题,云边协同应具备以下技术方案和能力:
第一
云边两级管控架构
第二
云边数据协同
第三
云边状态感知
图15 云边系统管控架构
31
03 边缘节点装配
边缘云的计算、存储、网络等核心服务是基于大量的边缘节点提供的,节点资源持续动态变化,部
署效率和部署质量显得愈发重要。
边缘节点的状态变化包括节点新建、节点扩容、节点缩容、节点裁撤等场景,这些变化与节点软硬
件状态相关,边缘节点状态变化所依赖的软硬件部署、安装、配置、管理等操作统称为边缘节点装
配。
边缘节点装配方案的标准化和自动化能够极大提升节点交付效率,保障交付质量,面临的挑战主要
包括:
大部分装配动作是基于互联网远程控制完成,首先要重
点设计装配动作的异常处理机制,确保装配流程的成功
率和效率,规避需要现场操作解决异常问题。另外还需
要进行安全方面的考虑和设计。
边缘节点装配从节点架构物理实施开始,到最终软件部
署和配置,达到节点上线服务标准,需要经过不同层次
不同人员复杂链路的处理,并要求有很好的上下游流程
衔接,需要对流程有高度的抽象和提炼形成固定流程模
型,兼顾标准化和扩展性。
为了提升装配和交付效率,需要进行高度的自动化设
计,将各个实施动作形成流程定义和系统化能力,最终
将人工介入操作的比例降到最低。高度自动化除了提升
效率,还能确保装配动作实施的质量,减少人工操作失
误带来的影响。
除了节点新建、节点扩容、节点缩容、节点裁撤等各种
装配需求场景外,还要充分考虑边缘节点规模、节点架
构、节点能力、硬件异构、软件版本差异等带来的差异
化,承载节点异构带来的复杂度。
远程装配
流程模型定义
自动化程度
装配场景复杂
32 边缘技术演进与发展白皮书
边缘节点装配包含了不同层次的复杂操作,在流程上可以按阶段划分的。以节点新建为例,装配流
程包括了节点物理设施装配、基础环境装配、应用软件装配及装配验收等环节,如下图所示:
发起流程 物理设施
装配
基础环境
装配
应用软件
装配 装配验收 流程完成
图16 边缘节点装配流程
物理设施装配
应用软件装配 装配验收
基础环境装配
节点交换机、服务器等硬件按照节点架构进行建
设和配置,一般需要现场操作,使节点具备网络
远程访问能力,为后续远程无人装配打下基础;
节点所有应用的部署和配置,包括虚拟化组件、
服务应用、管控应用等;
节点交付前验收,确保前置流程中的装配结果符
合要求,检查安装、部署、配置结果是否存在问
题并进行处理。
交换机远程初始化配置、服务器操作系统安装
配置等节点环境初始化动作,包括驱动、补
丁、通用基础组件等安装,这一步开始后续流
程均可以远程自动化操作;
33
NODE
34 边缘技术演进与发展白皮书
35
边缘云典型应用场景
01 边缘云应用场景发展趋势
数字化和元宇宙时代,边缘云将广泛服务于企业应用和民生场景。随着物联网快速发展和元宇宙概
念带来的数字世界与物理世界的融合,互联网连接和数据正在呈指数级增长,数据类型、数据生
产和消费速度、数据可变性都在持续增加。在此背景下,互联网用户的体验和网络效率面临极大挑
战,对云服务提出了更高的要求:
实时性,极致访问体验。时效性的降低会给业务带来不可预期的影响,集中处理会导致全球不同
地区用户访问体验不一致;
大带宽,稳定业务连接。大量边缘侧数据传送至云中心做整体分发,会产生巨大的网络带宽压力
及高额的带宽成本;
场景化,更加高效智能。机器学习、视频处理、AI数字人等场景化需求,需要分布式高效的处理
能力。
图17 互联网体验需求
影响1%的收入 如果视频加载超过7秒 算力增长比例
实时性
极致
访问体验
大宽带
稳定
业务连续
场景化
更加
高效智能
100毫秒 延迟 87% 放弃访问 70%~80% AI
1
2
3
36 边缘技术演进与发展白皮书
边缘云发展的技术驱动力来自5G和物联网的高速普及,从实践中看,部署在云端和终端的业务有
一部分更适合部署在边缘侧,以解决响应实时性和集中带宽拥堵压力等问题,因此,中心和终端业
务正加速向边缘云发生迁移,形成边缘云的两大业务趋势:
边缘云在新兴业务和场景下实现了低延迟、高带宽,以及满足适度的边缘自治权和安全性等多重需
求,为企业和用户提供了易接入、场景化、广覆盖的分布式基础资源,满足业务发展诉求并能够持
续迭代优化。
云端算力下沉,中心云计算模式无法满足海量终端的“多连接、低时延、大带宽”需求,更无法
支撑业务系统分布式架构变革,边缘云平台更贴近终端侧,能够更便捷的解决此问题;
终端算力上移,终端业务云化可以带来更低的成本优势和更高的业务灵活性,边缘侧相比中心云
侧更加灵活,可根据终端业务形态轻量定制,能够以最小代价支撑终端业务云化。
图18 边缘云业务发展趋势
1
2
37
推流、转码、分发等视频业务通常希望尽可能做到全域覆盖,提升全国任意位置的用户访问体
验,同时,对网络流量成本强敏感,这就需要服务架构能够很好的平衡二者;其次,对资源交付
周期要求高,期望能够快速获取弹性基础资源。边缘云节点为此类业务提供分布式的基础设施资
源,通过将云上业务下沉到边缘的方式,就近为用户提供访问,提升服务体验。
边缘云依托CDN资源底座,广域分布,覆盖大部分省市和运营商,全域单线和三线节点相结合,
组成层级边缘节点框架,能够覆盖全网客户,同时,边缘带宽与专线结合,保证边缘到中心云间
的网络质量;边缘带宽相比中心带宽具有更高性价比,能够有效降低收发流网络成本;边缘云计
算相较传统IDC模式极大提升交付效率,从按周交付提升到按分钟级交付,满足用户按需使用的
要求。
流量型场景是边缘云服务落地实践最为广泛应用的场景,在互联网视频、动态网站等业务领域边
缘云模式已大规模运行。
02 流量型场景
伴随互联网网站、长/短视频业务发展的云视频、云直播、泛CDN PaaS等大流量型服务随互联网流
量持续增加,面临成本、用户访问体验等多重压力。
图19 流量型场景边缘解决方案
38 边缘技术演进与发展白皮书
03 终端云化场景
云游戏/云渲染等终端业务云化趋势明显,终端业务上云也为终端业务改造和云系统的承接能力带
来很大挑战。边缘云为此类业务联合提供分布式多形态的基础设施和相关技术能力。
在游戏业务上云过程中,云端游运转模式重,交付速度慢,自建成本和交付周期无法满足需求;云
手游方案不成熟,无市场竞争力,自研安卓模拟器+X86硬件方案成熟度低,难以大规模应用。
边缘云基于原生硬件方案提供完美兼容能力,安卓AIC多开、串流等原子能力帮助客户快速构建云
手游完整方案;云微端SDK,提供外设模拟和串流编解码能力;分布式异构资源,为用户提供高性
价比、广泛接入的GPU资源,端游和手游成本均有大幅降低;此外,边缘云具有成熟的交付和管理
体系,帮助用户快速铺开业务的同时,还能够提供标准云服务,例如,负载均衡、NAT、弹性公网
IP等,支撑业务调度和公网服务。
边缘云服务为终端云化业务提供中间平台,既能提供一定性能的计算能力,又紧贴终端设备,能够
实现相对平滑的业务迁移,在新兴行业实践较多。
图20 终端云化场景边缘解决方案
39
04 政企边缘云场景
这类第三方服务商具有IDC或云服务商资质,希望重点发展云服务业务模式,具备自有售卖体系,
可触达特定政企客户和中长尾客户,但云平台研发和运维技术积累不足或无力承担相关成本。边缘
计算的复杂技术栈和巨量的建设初始投入另这类服务商对边缘计算商机不敢迈出第一步。
边缘计算平台为此类业务提供混合云产品,打造资产自持的边缘云能力;起始规模很小也可以提
供全面的云服务能力,建设成本压缩至1/3,投入成本与可售卖资源量为线性比,依托统一管控平
台,可按需灵活进行单节点和多节点的扩容管理。
在商用边缘云场景,边缘节点支撑用户业务转型,快速投入边缘云计算行业,为用户减轻运维压
力、专注自身业务运营。
图21 商用边缘云解决方案
对于第三方边缘计算服务商,边缘云帮助其建设边缘节点,提供交付和运维服务,第三方边缘计算
服务商基于此可以对最终用户完成各类边缘云服务的交付。
1 商用边缘云
40 边缘技术演进与发展白皮书
政府、医院、大型国有企业、传统制造业企业等企业在智能化转型过程中,借助边缘计算平台轻量
化等优势,可以将IT系统部署在任意需要的位置,是转型很好的切入点。内容中台、流化平台、呼
叫中心平台等中台服务通常基于自建边缘云节点基础设施,部署自有应用,同时通过边缘云平台服
务能力,获取业务整体解决方案。
用户自用边缘云场景以边缘IaaS需求为主,通常有厚重的存量信息系统历史包袱,亟待基础设施改
造或系统云化;同时面临新增的信息化建设需求,需要新、旧系统融合或平滑过渡;敏感数据安全
存储和传输也被提出了更高的要求。
边缘云平台为此类场景提供边缘基础设施资源层面的全栈服务能力,能够兼容数个不同的硬件终端
设备,提升服务持久度,也能满足各类云服务需求;同时,搭配核心安全服务保障敏感内容安全传
播。
自用边缘云
图22 自用边缘云解决方案
2
41
42 边缘技术演进与发展白皮书
43
边缘云技术发展展望
从边缘云技术发展的角度看,边缘云技术既要符合云计算发展的技术路线,也要满足边缘创新业务
和场景的新需求。这就对边缘云技术的软硬件均提出了很高的要求。总体看来,“融合”技术和“
协同”技术将成为边缘云技术发展的核心。
在计算技术方面,算力虚拟化技术在边缘也逐渐向着边缘云原生的方向发展,同时要满足一云多态
的融合计算技术发展方向。
在网络技术方面,超融合网络架构是边缘网络的主要趋势,同时要满足与通信网络,专有网络等网
络技术进行融合的趋势,向云网融合的方向发展。
在存储技术方面,分布式“缓存”技术将逐渐成为边缘云存储技术的主流,既要能够通过分布式集
群保证数据存储的安全性,可靠性,冗余和备份要求,同时也要满足数据读写的时效性和周期性要
求。
在边缘管控技术方面,统一的管控技术会持续升级,同时也会在中心与边缘间,建立起完善分级管
控机制,实现边缘云在资源和业务层面的协同统一。
在边缘硬件基础设施技术方面,随着智能网卡,GPU,NPU等异构设备的引入,未来边缘硬件将会
支持集成大量的异构设备,同时,为了满足边缘场景的定制化需求,也会出现很多的定制化设备。
随着技术的发展,标准的布局和工作也变得越发重要。随着边缘云行业标准的逐渐完善,边缘云技
术领域的相关术语定义、基础服务能力等通用要求也随之健全,同时,标准也在逐步规范边缘云
技术与服务的发展。未来,行业将持续推进边缘云标准化进程:边缘云硬件方面,重点围绕场景化
应用的边缘云硬件(云游戏、云应用、编解码、裸金属等)、边缘云一体机等;边缘云平台服务方
面,重点围绕边缘原生(边缘云容器、Serverless、网格)等;边缘云管控方面,重点围绕边缘云
管、自动化运维、全域调度等;边缘云应用方面,重点围绕面向行业和应用场景边缘云服务(政
务、工业、音视频等)等。
未来,随着边缘云技术和标准持续演进发展,将推动边缘云在更多行业和场景实践应用,拓展云服
务边界,助力算力分布式、泛在化发展,加速各行业数字化转型进程。
44 边缘技术演进与发展白皮书