构建全国一体化算力网:多方参与打破“算力孤岛”丨算力网风云③

艾媒咨询|2023年中国AIGC行业发展研究报告

随着人工智能技术的不断发展,AIGC技术也日益成熟,广泛应用于更多领域,其广阔的应用前景将推动AIGC市场规模快速增长。艾媒咨询预测,预计2023年中国AIGC核心市场规模将达79.3亿元,2028年将达2767.4亿元。

艾媒咨询|2023年中国AIGC行业发展研究报告 精品决策

  编者按

  在数字经济潮涌与大模型井喷的时代,算力正如水、电一般,逐日成为现代社会赖以生存的稀缺资源。可以说,谁拥有了算力的主导权,谁就捏住了面向人工智能的头等船票。

  这样的时代巨浪下,我国的算力也已步入高速发展新阶段。截至2023年底,我国提供算力服务的在用机架数达到810万标准机架,算力总规模居全球第二位。

  在此过程中,构建全国一体化算力网,更是应对新一轮科技革命和产业变革的重要举措。2022年2月,“东数西算”超级工程的启动,尝试拉开下一个时代的序幕。今年的《政府工作报告》明确指出,2024年要适度超前建设数字基础设施,加快形成全国一体化算力体系。

  在“东数西算”工程公布两年之际,当前我国算力网体系建设现状怎样?如何进一步强化全国一体化算力体系?在推进全国一体化算力体系建设的过程中,存在哪些难点堵点?就此,21世纪经济报道将推出“算力网风云”系列报道,围绕中国算力一体化体系建设现状、难点与堵点、产业链机会等进行全方位解读。

  专题第三篇聚焦全国一体化算力体系建设。当前,我国算力资源分散、利用效率不高。无论是企业还是政府,都希望解决这个问题。政策方希望建立一张覆盖全国的“算力网”,降低算力成本、提高利用效率、扩大使用规模。本文将回答“算力网”中每个参与主体如何定位、如何确定有效的协同机制等问题。

  全国一体化算力网的构建,走向纵深,按下加速键。

  “算力是数字经济时代的新型生产力。算力网是支撑数字经济高质量发展的关键基础设施。”国家发改委等部门关于“加快构建全国一体化算力网的实施意见”中,这样表述“算力网”——通过网络连接多源异构、海量泛在算力,实现资源高效调度、设施绿色低碳、算力灵活供给、服务智能随需。

  人工智能的发展,为算力网络产业链的上下游企业带来了新的增长空间和发展机会,挑战也随之而至。

  中国信通院云计算与大数据研究所所长何宝宏在接受21世纪经济报道记者采访时表示,当前,算力互联互通仍面临三大挑战,包括算力市场分散、调度能力不足、计算框架不同等,需要从顶层统一部署,建立有效的协同机制,并深入产业链细节,构建算力互联网体系结构。

  在全国一体化算力网建设中,经政府牵头,运营商、算力中心企业、软硬件厂商等市场主体,立足于自身所长,发挥着不同的作用。在此基础上,加强产业协同,以点成“链”,最终以“链”成网。

  算力:加大供给

  多位算力行业人士在与21世纪经济报道记者的交流中,总结了算力网络的主要市场参与方。其中,运营商企业作为数字基础设施建设的国家队和主力军,积极投入全国一体化算力体系的建设。通过构建一站式服务平台、提升算力传输能力、优化算力中心布局、强化算网安全体系建设等方式,推动算力网络的创新发展。运营商企业在算力一体化建设中既是建设者,也是服务提供者,通过自身的技术和资源优势,为算力一体化建设提供有力支撑。

  算力中心企业是算力基础设施的核心提供者。建设和运营算力中心,能够提供海量的存储空间和配备强大的计算能力,为大数据处理、人工智能等应用提供了强大的后盾,是算力一体化建设的基石。

  软件厂商为数据中心提供所需的操作系统、虚拟化软件等基础软件平台以及开发各类应用软件,推动算力资源共享,释放算力潜能,实现业务价值最大化,是算力一体化建设的重要力量。

  硬件厂商在技术创新方面发挥着引领作用。通过加大研发投入,硬件技术突飞猛进,包括处理器架构的优化、存储技术的革新、网络通信速度的提升等,为算力一体化建设提供有力支撑。

  自2022年正式启动“东数西算”工程以来,我国算力基础设施建设取得显著成效,8大国家枢纽节点、10大数据中心集群发展均取得了阶段性成果。据IDC圈统计数据,我国目前已经建成或正在建设的智算中心超过20座,分布在北京、上海、深圳、杭州等各地城市,南京智能计算中心已经投入运营。

  工信部数据显示,截至2023年底,全国在用数据中心机架总规模超过810万标准机架,算力总规模达到230EFLOPS(即每秒230百亿亿次浮点运算),居全球第二位。

  随着生成式人工智能不断发展,带动智算需求指数级增长,算力结构正在发生系统性质变,未来需要大规模的智算支撑。“智算需求每3到4个月翻一番,算力需求非常惊人,智算是未来重点发展方向。”中国信通院副院长魏亮近日表示。

  毋庸置疑,算力是新一轮风口。多位受访专家告诉21世纪经济报道记者,算力对于国内厂商来说是“有难度、但不得不应对的挑战”。

  中国移动董事长杨杰近日在2024中国移动算力网络大会上指出,算力成为新基础能源,是构成新质生产的重要驱动因素之一。特别是近期通用人工智能取得突破式进展,引发算力需求爆发式增长。杨杰表示,算力多元化、算网一体化、全域AI化是如今算力发展的三个趋势。

  像当初建立全国电力网一样,一张覆盖全国的“算力网”的建成也需要各方协同努力。在工信部等有关部门的引领下,各市场主体“各司其职”,目前已经组成了相对完善的算力网络产业链条。

  简单来说,通用算力、智能算力、超算算力等各类算力资源在国家枢纽节点规模化建设,为全国算力基础提供“蓄水池”,再对这些算力进行调度、编排、运营,以此构成一体化算力网的运行逻辑。

  而智算浪潮下,实体的智算中心可谓是“炙手可热”。国家信息中心发布的《2023年智能计算中心创新发展指南》中指出,智算中心作为信息基础设施的重要组成部分,为快速增长的人工智能算力需求提供必不可少的基础支撑。可以说,智算中心是算力的“据点”。

  多位参与智算中心建设的从业人员告诉21世纪经济报道记者,搭建智算中心是一个非常庞大且复杂的系统工程。如果要建立一个智算中心,首先需要服务器、需要芯片,存储设备等,这些是在机柜里的部分;而在机柜之外 ,还需要液冷等设备。这些均以大量的算力资源和资金实力来支撑,目前主要是三大运营商和互联网公司在深耕。

  中国移动已打造一批万卡级、千卡级智算集群,首批12个智算中心节点和智算产品体系在今年4月底发布;中国电信中部智算中心算力集群在今年1月投入运营,中国联通在青岛、芜湖等地建有智算中心。三大运营商算力资源丰富,而除此之外,阿里、腾讯等互联网公司等也在构建自己的智算中心,也包括其他少数市场主体,这些即为社会上的“异构算力”。

  据整理,今年中国电信的智算规模达到21EFLOPS,中国移动达到17EFLOPS。三大运营商不约而同地加大了算力上的资本支出,尤其是AI方面,近期招标公告显示中国移动和中国联通都有大规模人工智能服务器采购。

  今年4月底,中国移动还在其2024算力网络大会上正式发布了一体化算力网络领航数智产业行动计划,将联合产业各方推进“算力网络”从概念原型走向产业实践,构建超大规模智算中心、建设高速算间网络、打造新一代数联网、自主研发算网大脑,不断以技术创新推动算力网络发展走向纵深。

  何宝宏在接受21世纪经济报道记者采访时指出,整体来看,我国算力产业的发展路线需要围绕加强算力技术创新、推动算力产业协同发展、满足算力市场需求、促进算力产业绿色可持续发展布局。

  他表示,技术创新是算力产业发展的核心动力,不断推动算力技术的研发和应用,是提升我国算力产业全球竞争力的关键,包括但不限于加速全闪存、蓝光存储等新型存储技术的研发,提升算力中心的存储能力;推动异构计算、量子计算等多元化计算技术的发展,以满足不同场景的计算需求。

  另一方面,算力产业涉及多个领域和环节,包括设备、芯片、软件等。为了实现产业的整体发展和提升,需要选择产业协同发展路线,加强产业链上下游的协同创新和合作,构建先进的计算产业生态体系,推动产业链各环节的紧密配合和协同发展,共同应对市场挑战。

  网络:以网强算

  “国内单个的智算算卡还比不上国际先进水平,那就可以通过把算力的规模做大来弥补差距。” 新华三路由器产品线总经理汪小勇告诉21世纪经济报道记者,这无疑对网络提出了要求,用高效的网络连接把算力潜能释放出来,即“以网强算”。

  据汪小勇透露,国内网络的核心诉求是“无损”,即保证传输数据的完整性,同时也要保证传输速度和效率。这需要在低时延、零丢包、可靠性、负载均衡和确定性网络等方面下功夫。

  与算力方面类似,包括华为、浪潮、中兴、新华三等算力服务商也向三大运营商等提供算力网络解决方案;而另一方面,三大运营商自身所具有的基础设施优势在跨区域、长距离运输网络上发挥了重要作用。

  近日,发改委发布《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,其中提出的减低网络时延的目标是:1ms时延城市算力网、5ms时延区域算力网、20ms时延枢纽节点算力网在示范区域内初步实现。要做到这些,离不开三大运营商的支撑。

  一位深耕电子通信行业的券商分析师告诉21世纪经济报道记者,算力网的建设首先需要能够高速互联的网络,其次是能够进行跨数据中心之间的连接。三大运营商恰好两者兼具,成为全国一体化算力网建设的重要一环。

  在今年中国移动算力网络大会上,中国移动副总经理高同庆表示,中国移动针对长距离网络运输性能瓶颈,研发了新型高吞吐传输协议,将于今年开启联合验证。同时,中国移动在反谐振空芯光纤技术上取得突破,相比传统传输时延降低33%。

  中国电信400G超长距离全光运输技术目前已基本成熟。在近日举办的2024中国光通信高质量发展论坛上,中国电信研究院高级工程师张安旭表示,基于扩展C+L波段技术的超长距400G骨干网逐渐进入规模商用周期,将按节奏分步推进。

  中国联通在回复21世纪经济报道的采访时表示,其已在国家枢纽节点间形成超100G高速传输通道,筑牢面向算力网络全光传送底座,公众骨干IP网时延具备行业优势。

  在降低网络时延的同时,需要降低传输运费,缩减成本,从而加大算网普及力度。对此,中国移动等运营商、华为云等云服务商提出了“数据快递”。在海量数据和多条传输通道中优先选择更近的数据中心和路线进行传输,就近调度,提高效率。当然,这也与算力调度紧密相关。

  调度:协同诉求

  我国算力分布地域广、主体多,如果不能将这些资源整合调度,就会导致“算力孤岛”的出现。

  目前,我国在算力互联互通体系方面已取得初步进展。

  标准制定方面,中国通信标准化协会已启动《算力互联互通能力要求》系列标准研制,包括算力标识、算力调度、业务互通、数据流动等多个方面。

  系统创新方面,产业界主要厂商和科研机构围绕算网云操作系统、OGPU、ODPU、oneRDMA等开源项目开展研究,推动产业协同与算力互联网落地应用合作,促进形成繁荣有序的产业生态。

  工程实践方面,全国多地已开展算力互联互通实践验证。以北京为例,目前北京算力互联互通试验已通过统一算力标识、算网云操作系统等技术接入近20家算力提供商,在算力互联互通、算力调度、用户友好等试验验证方面取得进展。

  但是当前算力互联互通仍面临挑战。据何宝宏分析,一是算力市场分散,用户需汇总市场零散数据,算力感知获取成本高,“找算力”资源成本待降低;二是调度能力不足,“调算力”应用传输待提升,现有编排调度系统和网络条件较难支持大规模数据跨主体、跨地域频繁传输,导致计算效率低;三是计算框架不同,“用算力”架构适配待优化,各厂商算力资源接口、协议不统一,应用部署运行需要针对算力资源开展兼容适配,减缓跨主体部署效率。

  想要算力“活”起来,就必须需要一双能够集中调度全国算力资源的“手”。这也是建设全国一体化算力网的关键之处。以国家发改委、工信部牵头的有关政府部门和机构,希望算力网能够像电力网一样成为一项基础性建设服务,各个主体进行分工协作,再统一经营管理。

  据21世纪经济报道记者了解,三大运营商掌握丰富的算力资源和网络基础,是算网建设中的“排头兵”,因而也期望承担更重的责任。

  算力网络的运营与调度方面,中国移动提出了“算网大脑”概念,包括业务设计、资源感知、资源调度、能力接入等多个板块,支撑起数据快递、训推一体、分时复用等多项业务,并引入“九天”大模型,目前已经在芜湖落地;中国联通建立云网边一体化的算力网络调度平台,对算力资源进行协同安排;中国电信促进云网融合,以数据湖和云网大脑为基础对云网资源进行抽象及编排。

  在互联网公司“阵营”里,阿里云、腾讯云这些云服务商背后的互联网公司更多是站在企业的角度,有庞大的算力需求,也有一定的数据保密诉求。这些互联网公司希望能够建立起特定行业或者特定公司的专网,以满足算力调度和传输需要。同时,还存在一些异构算力。这些企业也在自建智算中心,期望能“分一杯羹”。

  “大家都有自己的解决方案,形成了多个算力局域网,类似于互联网初期阶段。因此,应该参考互联网的发展思路,构建算力互联网体系结构。” 何宝宏建议。

  这包括,融合互联、计算、网络等多层面软硬件技术,不断更新迭代算力资源应用方式,加速算力普惠化发展。也要构筑算力产业自主生态,通过开源方式联合产学研用各方参与技术研发与迭代,形成开放的技术生态,助力产业链上下游协同发展。此外,还要基于算力互联网体系架构形成算力大市场,促进算力与各行各业的融合发展,面向互联网、新零售等新兴行业与医疗、工业、农业等传统行业开展算力互联互通与算力应用试点,形成可推广、可复制的标杆案例,加速算力互联互通迭代升级,赋能产业数字化转型。

  东方证券分析师也认为,算力网络建设的四大方向包括建设公共算力平台、探索算力调度运营、中小企业接入算网和推动“算电一体”新型供能体系建设,这还需要各市场主体的继续努力。

  要实现算力的协同调度并不容易,将分散的算力集中起来、统一调度,仍任重道远。

艾媒咨询|2023年中国AIGC行业发展研究报告

随着人工智能技术的不断发展,AIGC技术也日益成熟,广泛应用于更多领域,其广阔的应用前景将推动AIGC市场规模快速增长。艾媒咨询预测,预计2023年中国AIGC核心市场规模将达79.3亿元,2028年将达2767.4亿元。

艾媒咨询|2023年中国AIGC行业发展研究报告 精品决策