首页> 数字经济 >2025 >第11期>  正文
突破算力产业发展瓶颈的可行路径及建议
来源:赛迪网-《数字经济》     作者:王成仁 中国国际经济交流中心研究员 2025-11-28 06:25:21
微信分享二维码

扫码分享到微信

关闭

随着人工智能、大数据、云计算等技术融合创新发展,全球算力产业呈现爆发式增长态势。我国算力产业发展迅速,但在美国对我国遏制打压的背景下,仍面临诸多挑战。国内诸多优秀企业进行了大量有益的尝试,为破解算力发展瓶颈提供了多元解决方案,值得总结推广。

我国算力产业发展现状及面临挑战

全球算力产业形成美中引领格局

全球算力产业进入指数级增长阶段,呈现出规模扩张与技术迭代双轮驱动特征。据中国信通院测算,截至2023年年底,全球算力基础设施总规模达到910 EFLOPS(每秒百亿亿次浮点运算),同比增长40%。其中,美国、中国分别位列第一位、第二位,占比分别为32%、26%。在生成式人工智能大模型爆发式发展推动下,算力需求大幅增长,智能算力增长尤为突出。根据第56次《中国互联网络发展状况统计报告》,截至2025年3月底,我国在用算力标准机架达1043万架,智能算力规模达到748 EFLOPS。国家数据局数据显示,截至今年6月底,我国算力总规模位居全球第二,日均Token(词元)消耗量已突破30万亿,较2024年年初增长300多倍。从算力芯片发展看,全球市场由少数科技巨头主导,呈现高度集中态势。根据东吴证券和WIND研究报告,英伟达凭借其在图形处理器(GPU)领域的技术积累和统一计算设备架构(CUDA)生态优势,在2024年生成式AI市场中占据92%的GPU芯片市场份额,处于绝对垄断地位。AMD(4%)、华为(2.2%)、英特尔、Cerebras、Groq等企业合计仅占8%。

我国算力发展呈现“多点开花”特征

我国算力产业已从规模扩张阶段转向高质量发展阶段,呈现出多维度、多层次的发展特征,形成了规模领先、结构优化、区域协同的产业格局。2022年我国开始实施“东数西算”工程,布局了八大枢纽节点与十大集群,东部枢纽节点聚焦人工智能、金融科技等热数据业务,西部枢纽节点承接后台加工、存储备份等冷数据业务。2024年以来,工信部等部门出台政策,推动东部地区先行先试人工智能、5G-A等新技术,西部在综合成本优势明显地区合理布局重大算力设施。在政策推动下,各地结合本地优势积极发展算力产业,内蒙古、贵州、河北等地逐渐成为数据中心建设重点区域。同时,互联网企业和云服务提供商是我国算力市场的主要驱动力。中研普华产业研究院发布的《2025-2030年云计算产业深度调研及未来发展现状趋势预测报告》显示,在公有云市场,阿里云、腾讯云占有率合计达62%;在政务云领域,华为云、浪潮云市场份额合计达55%。华为云、腾讯云、字节跳动等互联网企业和云服务提供商加速布局,开发大模型工具,推出适配DeepSeek等国产生成式人工智能技术的算力解决方案,极大促进了算力应用场景不断拓展。在金融领域信贷风险评估和反欺诈系统风险拦截、医疗领域影像诊断识别和机器人辅助手术、智能制造领域工业质检等算力应用领域“多点开花”。

我国算力产业仍面临四大挑战

一是高端芯片进口受限。由于美国加大对我国的限制力度,英伟达高端芯片进口受限,对我国算力产业发展带来明显制约。国产GPU芯片在绝对计算性能、能效比、工艺方面与国际旗舰产品仍有代际差距。在AI训练芯片领域,英伟达A100、H100等高端GPU占据绝对优势;在存储芯片方面,高端高带宽内存芯片仍依赖SK海力士、三星;芯片制造环节的短板更为明显,光刻机等关键设备受制于人,先进制程芯片量产困难;CoWoS、3D堆叠等先进封装技术在国际上广泛应用,而国内封装工艺能力尚难以满足超大规模芯片的封装需求。

二是技术创新能力与国外差距明显。在基础理论领域,芯片设计工具(EDA)、底层算法框架等方面与国际先进水平仍有差距。国际巨头在核心技术领域形成专利壁垒,国内企业面临高额诉讼成本,突围难。在软件生态方面,英伟达CUDA平台经过十余年沉淀,已形成覆盖数百万开发者的庞大生态,支持从AI训练到科学计算的各类应用。而国产算力平台的软件栈和工具链相对薄弱,开发者社区活跃度低。我国在AI算法和应用领域人才储备丰富,但在计算机体系结构、编译器开发、高速互连等底层技术领域的高端人才严重缺失,特别是具备跨学科背景的复合型人才。在市场竞争压力下,国内企业更倾向于加快应用推广快速迭代创新,而非加大基础研究投入进行长远技术布局,导致创新后劲不足。

三是算力资源分散缺乏协同。我国算力资源存在“碎片化”问题,各服务商算力资源接口和协议不统一,跨区域跨主体算力调度能力较弱,导致算力资源利用率偏低。企业自建数据中心受自身业务饱和度影响,利用率明显低于云平台部署的数据中心。部分数字经济不发达、产业数字化水平不高地区,虽建成智算中心、超算基地等大型算力设施,但实际应用场景欠缺,难以支撑大型算力设施的商业化运营。

四是产业发展制度环境仍待完善。与人工智能等快速发展需求相比,我国数字经济发展制度环境仍待完善,有关数据确权、使用和交易等方面的规则有待细化,企业标准与合规方面的挑战日益凸显。欧盟《数字市场法案》强制规范云服务互操作性标准,涉及12项数据迁移指标;《人工智能法案》将情感伴侣列为高风险应用,这些国际标准的变化对我国企业出海构成挑战。我国虽然出台了《AI虚拟伴侣产品和服务管理办法》等规定,但在算力互联互通、数据共享、隐私保护等方面的标准体系仍不完善。为满足合规要求,企业需建立数据分类分级保护体系,较高的合规成本也增加了企业的运营负担。

国内主要企业开展的有益尝试

以自主研发和计算架构创新突破硬件限制

面对高端芯片进口限制,国内主要芯片供应商通过进行全栈自研与架构创新,构建自主可控技术生态体系,寻求突破硬件限制的办法。中国头部芯片企业通过全栈式自主研发和计算架构创新,在硬件层面实现了对进口限制的有效规避。如华为昇腾系列AI芯片采用了完全自主设计的达芬奇架构,通过指令集优化和计算单元重构,在同等制程下实现性能突破。华为昇腾910C芯片采用7nm工艺,实测性能接近英伟达H100的60%,已能支持盘古大模型全流程训练,在政务云、智能安防等对自主可控要求高的领域,显著提升了国产芯片市场占有率。寒武纪思元370芯片作为全球首例采取芯粒(Chiplet)技术的AI芯片,通过将大芯片分解为多个小芯片,再用先进封装技术集成的方法,成功实现了性能倍增。

以优化软件生态和框架创新提升现有算力利用率

国内主要企业通过对软件生态进行深度优化、创新AI框架、应用轻量化模型技术、完善模型工具链条,以及促进系统级协同优化,显著提升了现有算力利用率,降低了对芯片硬件的依赖程度。如华为MindSpore开发面向全场景的AI框架,率先实现全自动并行框架,可根据硬件形态自适应生成相应大小的模型,极大地节省算力资源,实现精准计算。自开源以来,MindSpore社区贡献者已超过1500名,成为国内热度最高的AI开源社区。华为异构计算架构CANN通过软硬件协同优化、亲和昇腾的图编译技术及超过1000个高性能算子,充分释放了昇腾硬件的强大性能。腾讯、百度等企业通过重新设计算法和软件栈,运用小规模芯片集群实现更多功能,降低模型运行成本。阿里云推出魔搭GPT作为模型调用工具,实现大小模型协同完成复杂任务,降低对单一高算力芯片的依赖。

以云服务平台为依托拓展分布式算力解决方案

云平台是汇集算力资源、实现平台优化、边缘计算协同及提供分布式算力解决方案的重要载体。国内企业通过升级云计算基础设施、优化边缘协同架构、优化弹性计算模式、部署专业化算力服务以及构建分布式算力网络的方式,降低对高端芯片的依赖。如阿里云拥有部署大规模智能算力储备,支持最大10万卡GPU规模,承载多个万亿参数大模型同时在线训练。通过将AI模型训练、推理能力与云资源无缝对接,支持企业采取弹性计算模式提升算力利用率,实现了从“算力升级”到“智能升级”的跨越。华为Atlas系列覆盖了从推理到训练的边、云全场景,包括模组、板卡、服务器及集群。Atlas 200 AI加速模块仅半张信用卡大小即可支持16路高清视频实时分析;Atlas 500智能小站实现16路高清视频处理能力,性能较业界产品提升4倍。这种边缘计算设备与云端算力形成互补,构建了完整的“云-边-端”协同体系。华为与伙伴共同推出的100多个行业AI方案,如智能电力巡检、智能营业厅等,通过云边端协同架构实现了算力的最优配置。阿里云提出的MaaS(模型即服务)理念,以AI模型为核心搭建云计算技术和服务架构,向开发者开放包括模型训练、推理、部署、精调等专业化算力服务。

以超节点服务器系统集成创新谋求“弯道超车”

超节点是通过高速互联技术,将大量计算芯片整合成一个单元,以芯片间的超低延迟和高带宽通信来避免芯片空闲,形成“超级计算机”,支持千亿乃至万亿参数模型的训练和推理。华为、燧原科技、沐曦耀龙等头部企业均推动超节点AI服务器。华为CloudMatrix384超节点按照“一切可池化、一切皆对等、一切可组合”的架构理念,通过对硬件互联范式和软件协同机制进行根本性重构,将384颗自研昇腾NPU芯片和192颗鲲鹏CPU芯片,通过自主开发的MatrixLink高速网络实现全对等互联,形成算力高达300 PFLOPS(BF16,半精度)的超级AI服务器。服务器最多可容纳16万卡,网络时延微秒级,单卡推理吞吐量从每秒600Token(词元)上升到每秒2300Token,提升近4倍;算力从单台服务器的6.4 PFLOPS提升到300 PFLOPS,提升近50倍。根据研究机构SemiAnalysis发布的报告,华为CloudMatrix384超节点的算力达到英伟达旗舰NVL72系统的1.7倍,总内存容量是后者的3.6倍,内存带宽达到2.1倍。

政策建议

将超节点服务器作为突破芯片限制的重要手段

我国超节点技术的显著优势在于通过系统级集成与架构创新来实现算力利用率提升和资源优化,以减轻对高端芯片的依赖。在现阶段,超节点服务器可作为突破进口限制且满足国内算力需求的重要手段。我们应大力支持超节点在基础科研、工业与工程技术、能源勘探开发、高端装备制造、社会治理与公共服务、人工智能与深度学习等领域的推广应用,支持“云平台+边缘计算”模式发展,发挥云平台在集群性能、弹性、按需、可随时获取等方面的优势,鼓励政府机构及央国企优先以云服务方式使用超节点算力,通过算力券补贴方式降低企业使用成本,加快超节点应用推广步伐。

加大基础研发与关键核心技术攻关力度

科技创新是应对高端芯片限制的根本之策。应进一步支持架构创新,鼓励优质企业采用自主设计架构,优化指令集,重构计算单元,实现性能提升。拓展Chiplet(芯粒)技术应用范围,通过先进封装技术集成,弱化先进制程限制。鼓励新型计算范式发展,支持存算一体、光子计算等颠覆性技术研发。加力构建从设计到制造的完整芯片产业链,重点突破高速串并/并串数据转换接口、光电转换芯片、先进封装等关键技术,摆脱对外依赖。提升先进节点设计能力,支持国产设计工具研发及应用,优化多重曝光等工艺,促进先进封装技术研发应用,增强芯片产业链自主可控能力。

打造地方协同、开源高效的产业发展生态

切实发挥“东数西算”国家战略引领作用,促进各算力枢纽节点分工协作,基于资源禀赋和产业基础进行差异化布局,形成资源共享、算力协同发展格局。鼓励地方结合自身产业发展实际,与龙头云服务商合作,创新算力基础设施建设模式,促进技术标准统一和互联互通。支持龙头企业牵头组建产业联盟,吸引高校院所科研力量,集聚上下游企业资源,增强产业链供应链韧性,形成国产芯片和软件应用的良好生态。我们应大力发展自主AI框架、编译器、编程模型和工具链,营造开放活跃、开源高效的开发生态,吸引企业和开发者进驻,促进国产软硬件从“可用”向“好用”演进。

加强人才培养与制度保障

加大人才培养与储备力度,加强计算机体系结构、编译器开发、高速互连等底层技术人才培养,鼓励高校设立相关专业,培育新型研发机构,支持企业与高校共建人才实训基地。完善科研评价体系,支持科研人员长期从事基础研发,探索前瞻性技术。积极引进国际高端人才,解决海外人才落户生活、子女教育、跨境往来等问题。加快专门立法与数据规制,推动出台算力相关地方性法规或国家层面指导意见,细化算力定义、范围、管理职责和数据所有权、使用权、隐私权等规定。加强数据安全和个人信息保护立法与执法。推动构建统一的标准与评价体系,加快制定算力设施、信息通信设备等基础共性标准,以及算力计量、感知、调度、互通、交易等方面标准,支撑算力产业高质量发展。

(王成仁 中国国际经济交流中心研究员)

澳大利亚老年护理数字化转型实践经验及对我国的启示

当前澳大利亚老年护理数字化成本主要由养老机构与老年人共同承担澳大利亚老年护理数字化转型存在的主要问…

2025-11-28 06:11

智能制造对传统制造业转型升级的影响与路径探索

资金与风险管理智能制造转型升级作为企业一项长期的战略投资智能制造背景下传统制造业转型升级的路径探索…

2025-11-28 06:31
你可能也喜欢这些文章