查看原文
其他

分支机构动态| 算力互联互通元年大事记暨年度工作总结


2023年,是全面贯彻党的二十大精神的开局之年,是三年新冠疫情防控转段后经济恢复发展的一年,也是算力互联互通发展具有里程碑意义的一年。


在东数西算战略带来的算力跨域协同、以及通用人工智能大模型对算量算效的指数级增长需求牵引下,2023年3月,由北京管局与中国信通院推动建设的全国首个算力互联互通验证平台(北京算力互联互通验证平台)落地北京;6月,由多地管局参与的算力互联互通联合试验正式启动;10月,工业和信息化部等六部门印发《算力基础设施高质量发展行动计划》,要求“依托国家新型互联网交换中心、骨干直联点等设施,促进多方算力互联互通。”;“构建算力互联互通体系,统一算力资源标识和身份认证,依托部省算力互联互通平台开展试点验证。”


至此,算力互联互通正式登上历史舞台!


在算力互联互通从零到一的发展过程中,在工信部信管局指导下,中国信通院联合产业同侪接续奋斗、砥砺前行,自2022年10月,开启算力互联互通体系设计及规划工作,并联合多地主管单位在地方开展工程实践工作,经过一年的努力,“经历了风雨洗礼,看到了美丽风景,取得了沉甸甸的收获”。


——算力互联互通体系设想基本形成,并将持续探索!

——算力互联互通工程实践落地多域,并将扎实推进!

——算力互联互通技术路线谋定后动,并将竭力攻坚!

——算力互联互通标准体系初步建成,并将接续完善!

——算力互联互通产业生态有序构建,并将不断优化!

2023年中国信通院算力互联互通工作大事记


01

算力互联互通体系设想基本形成,并将持续探索!


经过一年多的探索与理论实践,在产业各方的共同努力下,算力互联互通体系设想基本形成。算力互联互通体系建设是为算力互联网体系建设的前置基础,是走向国家新型算力互联网阶段的关键一环,借鉴互联网发展经验,现已探索出以打通异企、异构、异地间的算力隔阂,实现高质量的资源跨域流动与一体化应用调度服务为目标,以算力统一资源码为抓手,基于“一套编码、一套标准、一套开源实现”,构建多层级算力互联互通平台中枢体系的建设格局。以探索互联互通关键技术要点并攻坚,建立统一开放的标准体系,建设良序完善、高质量协同的产业生态,促进算力产业支持实体经济智转数改高质量发展。



全国算力互联互通体系由国家算力互联互通公共服务和监测管理平台与区域算力互联互通平台体系(两级节点)组成。国家算力互联互通平台作为顶级节点对区域平台体系承担算力标识注册、算力互联可信度和合规性监测等服务和管理职能。


区域算力互联互通平台体系包含区域算力大市场公共服务平台、区域算力互联互通平台和区域算力调度服务平台三部分,其中,国家算力大市场公共服务平台(区域站)承担前端智能,以规范市场发展为目标,实现编码注册、需求发布、供需匹配、用户管理等公共服务能力;区域算力互联互通验证平台承担后端职能,实现算力标识注册、算网参数调度、身份认证管理、统一计量清算等核心能力。算力互联互通平台面向符合规范的算力调度服务商(算力调度服务平台)接入。




02

算力互联互通工程实践落地多域,并将扎实推进!


过去一年,多地管局联合中国信通院依托地方算力互联互通试验平台进行落地实践工作,由中国信通院牵头推进平台设计、技术验证等工作。目前各地试验平台已完成通用计算和超级计算的异构算力接入,具备算力资源感知、算力资源汇聚、算网一体化调度等能力,验证了跨服务商算力互联互通的可行性。


截至2023年底,已支撑将算力互联互通试验平台落地北京、重庆两地,总计接收算力编码 69011 条,接入天翼云、移动云、华为昇腾、曙光智算等15家算力服务商,包括:74 个可用区、288 万核 CPU、10846 卡 GPU、存储4827 PB,计算量300余PFLOPs,走通了友好用户验证、试商用等流程试点,取得阶段性进展。



北京算力互联互通试点圆满收官


基于北京算力互联互通试验平台的试点验证工作基本完成。现已成功接入天翼云、移动云、北京华为昇腾、西安华为昇腾、天津华为昇腾、曙光智算、世纪互联、宁夏电信、甘肃电信、青云、中联云港11家企业,包含超算、智算、通算在内的可用资源池71个,可用算力210PFLOPS,其中智算44PFLOPS。现已完成互通和调度试验。在人工智能模型训练、科学计算模型仿真等真实场景下,完成了跨服务商、跨地域的用户任务需求传递和数据文件流动试验,验证了跨企业算力互通和任务调度的可行性。



联合试验工作成效显著


今年6月起,北京市通信管理局同天津市通信管理局、内蒙古自治区通信管理局、上海市通信管理局、广东省通信管理局、宁夏回族自治区通信管理局联合开展算力互联互通试验,现已接入京外资源41.88PFLOPS,约在平台资源总池的20%。以京-津试验为依托,试验环京地区算力一体化能力,验证了环京地区满足跨省市、跨行业中心节点应用需求的通用计算、超级计算、智能计算等异构算力基础设施互联互通有效性。以京宁、京蒙试验为基点,验证了国家枢纽地区资源互联互通的可行性,面向“东数西算”应用场景,完成了跨域供需匹配、任务作业的大模型等场景验证。


除此以外,重庆、苏州工程实践工作稳步推进,贵州积极响应,进行京贵扩大规模联合试验。



03

算力互联互通技术路线谋定后动,并将竭力攻坚!


2023年,依托算网云开放社区及中国互联网协会算网云协同系统工委会,中国信通院专家牵头组织推进ODPU、OGPU、oneRDMA、CNCOS算网云调度操作系统等



开源项目,就核心算间互联技术、网间互联技术分别进行深入探索研究,现已发布算力统一资源码C-URL、高性能传输协议oneRDMA、统一异构GPU计算框架OGPU2.0、统一异构DPU计算框架ODPU2.0、一体化编排调度系统CNCOS算网云调度操作系统等核心技术阶段性研究成果。




04

算力互联互通标准体系初步建成,并将接续完善!


2023年,由中国信通院牵头在中国通信标准化协会及中国互联网协会立项算力调度、业务互通、数据流动、算力标识、云环境多GPU统一开发框架等相关行业标准和团体标准十余项,累计召开标准研讨会四十余次,完成5家一致性认证工作,积极研判产业发展动态,解决企业方向痛点,推动行业自律,消除产业隔阂。




05

算力互联互通产业生态有序构建,并将不断优化!


产业平台方面,在算力、网络、云计算融合发展的大趋势下,经过半年筹备,由中国信通院牵头筹建的中国互联网协会算网云协同系统工作委员会于2023年6月正式成立,先后得到50余家成员单位的积极响应,下设“ODPU”、“OGPU”、“oneRDMA”、“算网云调度操作系统CNCOS”四个工作组,组织开展行业调研二十余次,走访企业数十家,输出调研成果若干。于6月、12月分别召开两次全体成员大会,输出阶段性成果,郑纬民院士当选工委会主任委员。工委会成立半年来围绕构建一体化算力服务体系,促进算网云融合发展及算力互联互通体系构建,做出了诸多努力,取得积极进展,已经成为承载算网云融合技术创新、成果共享共建、构建生态链条、培育专业人才的重要平台。



生态建设方面,算网云开放社区是由中国信通院算力互联互通核心团队组织推进的算网云开源生态,同工委会相关工作组协同推进“ODPU”、“OGPU”、“oneRDMA”、“算网云调度操作系统”、“COCA”等开源项目,面向社会营造良好的算力互联互通开源环境。



对话机制方面,举办“算力互联互通论坛”、“算力互联互通大会”、研讨会及调研若干;推动产业协同与算力互联互通跨地域合作,支持地方政府间、智库间和企业间的生态共建。


展望

信通院算力互联互通团队将在体系设想、工程实践、技术攻坚、标准建设、产业生态方面持续发力。



2024年,将持续进行算力互联互通体系规划探索,为算力互联网建设打牢根基!


2024年,将继续完善算力互联互通平台体系,上线算力大市场公共服务平台,支撑更多地方管局筹建算力互联互通中心!


2024年,将加大力度对算力互联互通关键技术进行研究、攻克,呼吁产业各界积极参与相关技术试验!


2024年,将建立健全算力互联互通全套标准体系,进一步规范行业发展;面向相关企业,对其算力标识、DPU/GPU统一开发框架等进行一致性认证!


2024年,持续完善产业生态平台建设,为产业常态化对话机制建立贡献力量,依托工委会与开源社区开展相关实践活动;发起联百业·通万企“算力供需互联专项行动”,拉通算力互联互通产业链。


回首2023年,我们砥砺深耕,步履铿锵,

展望2024年,我们奋楫笃行,履践致远!

信通院算力互联互通团队诚谢产业同仁在过去一年对算力互联互通事业的坚定支持,与推进产业发展做出的努力贡献!



联系人:

蔡老师 15010051876 caiyu@caict.ac.cn



来源:算网云协同系统工作委员会

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存