2025 年,中国生成式人工智能(AI)领域迎来爆发式增长。中国互联网络信息中心(CNNIC)最新报告显示,截至 6 月,国内生成式 AI 用户规模达 5.15 亿,半年增长率高达 106.6%,超九成用户首选国产大模型(如通义千问、文心一言)。与此同时,全球算力租赁市场正以年增速超 20% 的态势扩张,预计 2026 年规模将突破 2600 亿元,英伟达 GB300 芯片三季度放量与推理需求爆发成为核心驱动力。本文将深度解析这两大趋势背后的技术逻辑、市场机遇与行业挑战。

一、国产大模型:从技术突破到规模化应用的跨越

1、用户增长的核心引擎

2025 年上半年,国产大模型凭借性能迭代与本地化服务优势,推动用户规模从 2.49 亿跃升至 5.15 亿,普及率达 36.5%。这一增长得益于三大创新:
  • 多模态能力突破:通义千问 3.0 支持文本、图像、视频的跨模态生成,文心一言 4.0 实现代码解释与调试能力,显著提升复杂任务处理效率。

  • 推理成本下降:阿里云 Aegaeon 计算池化技术使单卡同时服务 7 个模型,推理成本降低 60% 以上。

  • 行业场景深耕:医疗领域的 “龙影” 大模型(RadGPT)可 0.8 秒生成医学影像诊断报告,工业质检场景中盘古大模型将准确率提升至 99.7%。

2、政策与生态双轮驱动

国家发改委等部门将 AI + 储能纳入能源战略,推动大模型在电网调度、工业制造等领域的落地。同时,国内已形成覆盖芯片(昇腾 910B)、框架(MindSpore)、模型(星火认知大模型)的全产业链,超 188 家大模型通过国家级备案,263 款应用完成登记。

3、全球竞争力凸显

中国 AI 专利申请量达 157.6 万件(占全球 38.58%),在自然语言处理、计算机视觉等领域的论文引用率全球领先。华为灵衢超节点架构、阿里液冷技术等创新成果,正重塑全球算力基础设施格局。

二、算力租赁:千亿级市场的爆发与重构

1、需求结构升级与技术迭代

  • 训推需求分化:生成式 AI 商业化推动推理算力需求激增,预计 2025 年推理算力占比达 60%,日均 token 处理量从 4 万亿增至 40 万亿。

  • 硬件性能跃升:英伟达 GB300 芯片搭载 288GB HBM3E 显存,推理效率较 A100 提升 4 倍;华为昇腾 910B 通过液冷技术实现单机柜功率 50kW,支撑大模型分布式训练。

  • 商业模式创新:算力租赁从 “租卡” 转向 “租算力”,通过异构资源调度平台使资源利用率提升 40%,算力券补贴政策降低企业使用成本 45%。

2、市场竞争格局与国产替代

  • 大厂主导生态闭环:AWS、微软等超大规模企业占据高端算力市场(租金超 4 美元 / 小时),而中小厂商通过降价争夺客户,导致市场分化加剧。

  • 国产替代加速:受 H20 禁令影响,阿里张北云脑项目改用昇腾 910B,腾讯通过通用服务器兼容国产卡,降低客户迁移成本。大湾区国产算力适配中心已为 5 家企业提供昇腾 910B、昆仑芯 P800 等芯片的适配验证服务。

3、未来增长动力

  • 垂直行业渗透:医药研发(靶点筛选)、气象预测等领域定制化训练需求崛起,2025 年训练算力占比预计从 20%-30% 提升至 40% 以上。

  • 全球化布局:xAI 融资 200 亿美元扩建 Colossus 2 数据中心,目标 2026 年算力达 2 ZFLOPS,同时配套建设 1 千兆瓦发电厂以保障能源供应。

三、技术融合与行业挑战

1、AI + 算力的协同创新

  • 边缘计算深化:将 RTX 4090 GPU 与边缘云结合,使图像识别延迟降至 300ms 以内,支撑实时工业质检与智能客服场景。

  • 绿色算力趋势:浸没式液冷方案使单卡租赁价格提升 15%-20%,但能耗降低 40%,预计 2026 年液冷市场规模达 800 亿元。

2、风险与应对策略

  • 数据安全合规:欧盟对英伟达展开反垄断调查,国内企业需加强数据主权保护,如采用联邦学习技术实现 “数据可用不可见”。

  • 技术依赖风险:训练端仍依赖英伟达 A800 等旧型号芯片,国产替代需突破架构设计与生态适配瓶颈。

中国生成式 AI 用户规模的爆发式增长与算力租赁市场的千亿级蓝海,标志着我国正从 “技术追赶” 转向 “生态引领”。国产大模型凭借性能突破与政策支持,已在全球竞争中占据一席之地;算力租赁行业则需通过技术创新与国产替代,构建自主可控的算力基础设施。未来,随着 AI 与算力的深度融合,医疗、工业、能源等领域将迎来智能化升级的新浪潮。