AI大模型训练外迁的合规挑战与应对

2025年底,一则消息引发全球科技界关注:多家中国大型科技企业,正将AI大模型训练的关键环节迁移至海外。

具体操作方式是在新加坡、马来西亚等东南亚国家租用或自建数据中心,使用部署在当地、性能强大的英伟达H100、H200等高端GPU集群进行大规模预训练。

这一趋势迅速获得《金融时报》、路透社、《日经亚洲》等多家国际媒体的跟进报道。印度媒体甚至直接指出,东南亚已成为中国企业 “获取高端GPU的绕行路径”。

产业界普遍确认,中企的海外AI训练趋势不仅真实存在,且具备坚实的产业驱动力。这展示了中国科技企业在全球算力版图上的一次主动布局调整。

一、为什么选择海外训练?

目前,美国对华出口管制主要聚焦于物理芯片的跨境流动,尚未明确将“海外数据中心向中国主体提供算力”直接认定为违规出口行为。这一政策空窗期为企业提供了实际操作的空间。企业通过在新加坡、马来西亚等第三国合法获取并使用高性能GPU,能够在不断升级的硬件管制背景下,维持AI模型的训练能力。

此外,海外训练也符合多地监管的阶段性特征。美国政策仍在演变中,云端算力监管尚未完全落地,企业利用当前窗口期布局海外算力,成为一种务实选择。

二、目前的有效合规路径是怎样的?

(1)中国:核心在于“数据属性”而非“地理位置”

根据中国《数据安全法》《个人信息保护法》等相关法规,企业开展海外AI训练时,需严格判断训练数据是否涉及个人信息、重要数据或敏感数据出境。如果训练数据中包含上述类别,企业必须完成数据出境安全评估,或采用标准合同、认证等合规路径。

因此,多数企业采取“海外训练基础模型 + 国内微调”的双阶段模式:

  • 海外训练阶段:使用公开数据、合成数据等非敏感内容进行预训练,避免触发数据出境审查;
  • 国内微调阶段:在境内使用真实业务数据和用户数据进行模型优化,确保数据不违规跨境。

此种模式既满足了中国的数据监管要求,也兼顾了模型训练的技术可行性。(2)东南亚国家(新加坡为例)

新加坡在数据中心和云计算服务方面持开放态度,其《个人数据保护法》(PDPA)和《网络安全法》虽对运营商提出客户识别(KYC)、数据安全等技术要求,但整体政策环境对跨国科技企业较为友好。这也使新加坡成为中企海外训练的重要节点。

然而,企业也需意识到,第三国监管并非静态不变。随着中美科技竞争加剧,东道国政策可能受外部压力影响而调整,因此企业应将海外节点视为“可选项”而非“唯一依赖”。

三、云算力监管逐步落地,未来如何应对?

AI企业面临的出口管制与数据合规挑战并非孤例。半导体、工业软件、航空航天等行业早已开展多层次合规布局,以半导体行业为例,其在应对美国出口管制方面已形成一套成熟策略,极具参考价值。该行业普遍采用“境外研发与设计,境内制造与集成”的分布式业务架构,将受管制程度较高的EDA工具使用、先进制程研发等环节置于海外合规环境,而将涉及国家信息安全与产业核心竞争力的制造环节保留在国内。同时,企业积极构建“多来源、可替换”的供应链体系,通过引入国产设备、材料及非美系供应商,降低对单一技术路径的依赖。在技术层面,通过模块化设计与接口标准化,确保特定环节在受限时可被替代方案快速接替,保障业务连续性。

其应对策略具有高度可迁移性:

  • 供应链多源化:在GPU、服务器等关键硬件中引入国产替代与多国供应,避免单一依赖;
  • 业务架构分布式设计:将训练、仿真、研发等环节部署于不同司法管辖区,降低整体合规风险;
  • 数据分级与隔离:明确数据分类(公开、业务、重要、核心),实施“可出境/不可出境”双轨策略;
  • 合同风险管控:在服务协议中增设政策变更条款、数据本地化要求、替代履行机制等内容,提升法律韧性;
  • 治理体系升级:建立融合出口管制、数据合规与技术安全的综合治理架构,实现合规前置化管理。

(本文作者:盈科李谦律师 来源:微信公众号 盈科新视野)