GxP 中的 AI/ML 验证：GAMP 5 附录 D11 解读

系统梳理 GAMP 5 附录 D11 与 GxP 语境下 AI/ML 验证的关键差异、风险为本方法、数据完整性与持续监测要求，并结合案例给出可落地的验证框架。

Posted Jan 4, 2026

By Alden Wang

views 51 min read

执行摘要

AI 与 ML 正在制药生产中找到立足点——从实时工艺优化的数字孪生，到预测性质量分析——但随之而来的，是监管与验证层面前所未有的压力。

GxP 法规体系（FDA 21 CFR Part 11、EU GMP Annex 11）对计算机化系统提出了明确要求：验证、安全、数据完整性，三者缺一不可。监管机构的重心正在转移——从刚性测试框架，转向基于风险的计算机软件保证（CSA）。与此同时，行业指南也在跟进：ISPE GAMP 5（第二版）已将 AI/ML 纳入附录 D11，并在此基础上衍生出专项的 GAMP AI Guide（2025）。

多位专家指出，在 GxP 框架下落地 AI，意味着”把验证视野向外延伸”——模型训练、训练数据集、持续监测，都必须纳入管控范围。数据完整性依然是核心命题：模型的每一条输入、每一次 prompt 调用、每一条输出，都是 GxP 记录，必须满足 ALCOA+ 原则的完整可追溯要求。风险管理也必须正视 AI 特有的风险源——模型偏差、训练数据质量——并将其与常规风险并列评估。

本文系统梳理上述议题：对比 AI 系统与传统已验证系统的差异，回顾现行指南，呈现典型案例（GSK 疫苗数字孪生、ML 驱动的水质预测），并展望新兴标准与监管趋势。

结论是：AI/ML 引入了”黑箱”特性与持续演化（新数据涌入、模型漂移），但 GxP 的核心命题——适用性、患者安全、数据完整性——并未因此改变。只要落实基于风险的验证、扎实的数据治理与持续监测，组织就能在 GxP 制造中负责任地用好 AI/ML，并与不断演进的监管预期保持同步。

引言与背景

AI 与 ML 正在快速渗透制药生产领域。应用场景横跨工艺监控、预测性维护、质量控制与实验室自动化——数字图像分析做缺陷检测、优化处方参数、预测设备性能，不一而足。行业分析师估计，生成式 AI 每年将为医疗健康与制药行业带来约 600–1100 亿美元的生产力提升，常规任务的自动化率可达约 80%。GSK 与 Siemens、Atos 联合开发的疫苗生产线数字孪生，就是一个典型：实时虚拟副本接入真实工厂数据，加速疫苗开发，并将工艺参数持续保持在最优状态。

然而，制药企业身处高度监管环境。GxP 体系（GMP、GLP、GCP）要求在生产与质量的每一个环节设置控制措施，以保障患者安全与产品质量。FDA 21 CFR Part 11 与 EU GMP Annex 11 要求电子记录与签名必须可信、可归属、安全——本质上等同于要求计算机化系统经过验证。历史上，验证意味着对软件与流程进行穷尽式测试，并将测试用例与签名装订成册。

GAMP 5（第二版，2022）为 GxP 系统验证提供了基于风险的全生命周期方法：明确需求、风险评估、完善文档、变更控制、严格测试——并根据系统复杂度进行裁剪。附录 D11 专门针对 AI/ML，规定了机器学习生命周期的三个阶段——概念、项目、运行——并特别强调数据处理、模型训练与性能度量。ISPE GAMP AI Guide（2025）在此基础上进一步阐述了受监管场景下开发与使用 AI 赋能系统的最佳实践。

尽管指南已在演进，AI/ML 仍带来两个独特挑战：输出的非确定性与自适应学习。与固定算法不同，ML 模型在新数据上重训后会持续演化，由此产生”模型漂移”。深度神经网络等”黑箱”模型的输出，往往难以解释。这些特性让验证工作更加棘手。Bhariya 等人指出，ML 验证把风险重心从代码逻辑转移到数据质量与偏差上，对验证方案提出了新的要求。

对此，FDA、EMA、MHRA 等监管机构越来越多地倡导以基于风险的 CSA 取代 100% 测试用例覆盖，并更强调数据谱系与持续监控。行业思想领袖建议，将 AI 验证纳入既有框架（Annex 11、GAMP），但需要将控制范围延伸至训练数据、模型版本化与审计追踪。

下表对比了传统 GxP 系统与 AI/ML 系统在验证要点上的差异，展示了 GAMP 5 指导在何处适用、又在何处需要补强。

验证维度	传统 GxP 系统	AI/ML 系统（GxP）
需求规格	固定的用户/系统需求（功能、流程）	除功能规格外，还须定义 ML 目标（性能指标、误差容限）
设计与开发	确定性代码/配置，按规格工程化实现	迭代式模型开发；多算法对比，依据性能准则选型
数据处理	输入多为人工录入或传感器读数，通过审计追踪保障数据完整性	需对整个数据集进行清洗、去标识化与标注（ALCOA+ 贯穿全程）
测试与验证	预定义测试脚本，预期输出明确，通过/失败判定	大规模验证/测试数据集评估预测精度与偏差；可能需要在留出数据上重跑训练
变更/版本控制	正式变更控制；新版本上线前完成验证	模型版本控制，每次版本变更均有清晰审计追踪
运行监测	周期性确认（IQ/OQ/PQ）与定期复审	持续性能监测（漂移检测、KPI）；超出阈值触发再训练
风险管理	聚焦软件故障、安全等常规风险（ICH Q9）	新增 AI 特有风险：模型偏差、数据集完整性、可解释性；须评估 ML 输出的危害场景
文档	传统 VMP、URS、设计规格、测试脚本	新增：模型设计规格、数据完整性计划（将数据集与 prompt 视为受监管记录）

表 1：传统 GxP 计算机化系统与 AI/ML 赋能系统的验证活动对比。来源：GAMP 5 及相关指南；专家分析。

法规与标准版图

在 GxP 中部署经验证的 AI/ML，既要满足既有法规，也要跟上新近发布的指导文件（表 2）。

21 CFR Part 11 与 EU GMP Annex 11 是两根最粗的支柱：二者要求计算机系统确保记录的完整性、保密性与可追溯问责。这些条款对 AI 工具同样完全适用——每一个训练数据集、每一笔 AI prompt 交互、每一次模型输出，都应作为电子记录留存，并配套签名与时间戳，以满足 ALCOA+（可归属、清晰、同步、原始、准确，以及完整、一致、持久、可获取）标准。

ICH Q9（质量风险管理）为风险为本方法提供底层支撑。放在 AI 语境下，这意味着要把数据集偏倚、模型不确定性等新风险，明确纳入分析范围。

更具针对性的指导正在涌现。GAMP 5 附录 D11 梳理了以机器学习为中心的生命周期管理，强调性能指标与迭代训练。GAMP AI Guide（2025） 把 GAMP 5 理念与 AI 特性衔接起来，填补现有指导的空白。监管机构也陆续发声：FDA 的”AI/ML-Based SaMD Action Plan”与 EMA 的”Reflection Paper on AI in the pharmacy lifecycle”均强调透明性与人工监督。尽管它们并非严格意义上的 GxP 规则，但在 FDA/EMA 监督框架下，它们传递出对”可信 AI”的明确期望。

新出台的欧盟 AI Act（2023）将高风险 AI（包括医疗器械、关键系统）进行分类，并将强制符合性评估与文档化要求——这将直接影响欧洲范围内的 GxP 落地实践。

实践中，行业专家建议把 AI 系统映射到熟悉的法规框架中。Korrapati 等人的表述很直接：”Annex 11 和 Part 11 仍然适用，但如今我们必须把其控制措施延伸到模型训练管线、云平台以及再训练事件中。”这意味着要建立治理体系（政策、CAPA、变更控制），并与 GAMP 原则对齐，同时补充 AI 伦理、数据隐私（GDPR 合规）与模型可解释性方面的新政策。审计人员期望对 AI 生命周期管理的每一个步骤都有成文证据——本质上就是把 Part 11 的审计追踪逻辑，同样应用到 AI 数据与输出上。

另一个关键转变，是行业开始拥抱基于风险的计算机化系统验证（CSV）。FDA 及全球质量机构均鼓励以 CSA 替代”面面俱到”的穷尽测试，把资源聚焦在风险最高的功能上。在 AI 验证中，这意味着应基于风险评估，优先验证那些一旦失效会对患者/产品影响最大的模型。直接给出给药剂量建议的 AI 系统，其验证强度应远高于一个仅用于优化仓储物流的系统——验证力度可据此分级调整。

法规/指南	适用范围	AI/ML 特定考量
21 CFR Part 11（FDA，美国）	电子记录与签名；要求审计追踪、访问控制、数据完整性	将 AI prompt、模型输入/输出视为电子记录；审计追踪须捕获模型版本、用户 ID、训练事件日志
EU GMP Annex 11（欧盟）	计算机化系统；类似 Part 11，涵盖系统验证、备份、变更控制	将 Annex 11 控制延伸至 AI：系统影响风险评估；模型再训练纳入变更控制；训练集等数据须可追溯
ICH Q9：质量风险管理	风险管理（国际通用）；要求评估与控制产品风险	明确评估 ML 特有危害（数据偏差、模型漂移、可解释性）；确保训练数据覆盖所有场景
ISPE GAMP 5（第二版）	基于风险的计算机系统全生命周期指南（全球适用）	包含附录 D11（AI/ML）；推荐 ML 生命周期：概念、项目、运行三阶段；定义角色（模型所有者、SME 等）
ISPE GAMP AI Guide（2025）	GxP 系统中 AI/ML 最佳实践（2025年7月试行）	整合 GAMP+AI 知识；讨论数据偏差、透明性、数据质量与供应商期望；引入 AI 赋能系统验证框架
FDA CSA/FMLP 指南	FDA 倡导的基于风险验证（美国）	阐述良好机器学习实践原则（含数据集管理、透明性）；鼓励将验证内嵌于开发过程
EU AI Act（2023）	AI 法规（欧洲）；按风险分级，高风险 AI 须符合性评估；2027年合规截止	医疗/自动化 AI 多属高风险；将对 GAMP 验证系统叠加额外问责层（未来影响）
PIC/S GPG（计划中）	制药领域 AI 良好实践指南（预计发布）	预计提供受监管制药 AI 的最佳实践；将补充 GMP 要求

表 2：GxP 中 AI/ML 的法规与指导框架。既有法律（Part 11、Annex 11）对 AI 数据同样完全适用；较新的指导（GAMP 5 AI 附录、FDA/EMA AI 文件）与风险为本方法强调治理、数据完整性与持续验证。

基于风险的 AI/ML 验证框架

对 AI/ML 系统开展验证，需要一套结构清晰的基于风险的框架，并与 GxP 生命周期管理流程无缝衔接。业内专家提出了多步骤蓝图，整体思路与传统 CSV 高度相似，但增加了 AI 特有的补充内容。

第一步：使用场景（预期用途与风险画像）

准确界定 AI 要做什么，以及它如何嵌入 GxP 流程。把每一项 AI 功能与其对患者、产品、数据的风险逐一对应。

Korrapati 的判断很清晰：用于安全关键剂量决策的 AI，验证强度须比照医疗器械软件；用于日常事务的 AI（如库存报表），则可采用更精简的控制措施。这种与风险相称的思路（ICH Q9 概念）决定了验证投入的力度与深度。

第二步：需求与设计输入

编制面向 AI/ML 的用户需求规格（URS）与功能需求，既覆盖系统行为，也覆盖模型性能。

需求不仅要写清功能（如”按缺陷类型对片剂分类”），也要写清模型性能目标——准确性、灵敏度、误报率。非功能性需求须明确数据约束（格式、质量门槛、专有/非专有数据）以及可解释性要求。尤为关键的是，在项目早期就要为 ML 模型建立性能指标与验收准则。这些指标（precision、recall、RMSE 等）将成为验证的标尺。

第三步：数据策略与数据集构建

AI 验证的成败，系于高质量数据。

在概念与开发阶段，识别所有数据来源（内部与外部），评估数据的充足性、偏倚与相关性。制定数据完整性计划：将每一份数据集、标签与标注都视为 ALCOA+ 框架下的 GxP 记录，对数据规模、多样性与谱系（lineage）实施治理。

以使用公共数据（如开放临床数据集）为例，须确认具备合法使用权，并确保个人数据已去标识化。数据准备步骤（profiling、清洗、特征工程、匿名化、数据增强）须被记录、受控。Mintanciyan 等人强调，在项目正式启动之前，必须判断是否需要额外的数据获取项目来补齐缺口。数据标注与分区（训练/验证/测试集划分）须由具备资质的数据科学家完成，所有变换（特征缩放、编码等）都要在文件中完整留痕。

结论是：严格的数据治理至关重要——”并非所有数据生而平等”，只有干净且具代表性的数据集，才能确保模型有效性。

第四步：模型开发与工程化

AI 项目遵循软件开发生命周期，但采用迭代式试验模式。

传统瀑布阶段（设计、开发、测试）被”模型设计—代码/基础设施构建—训练—评估”的循环所取代。所有候选算法通过超参数搜索进行调优，每次迭代的结果均须记录。专家建议尽可能自动化这一过程（如使用可自动训练/评估的库），但同时也要对模型输出进行人工复核，并监控学习曲线（参见 FDA/Canada/MHRA 指南）。对每个模型版本的文件化记录——包括架构、超参数与性能——是实现可追溯性的关键。

第五步：模型测试与选型

模型训练完成后，使用训练过程中从未见过的留出验证数据集进行评估。

生成关键性能记分卡（准确性、ROC AUC、混淆矩阵），用于对比各模型。最终模型的选择以这些指标为依据：满足预先定义的验收准则，即作为发布候选。强烈建议开展可视化/定性复核（如检查分类错误或输出分布），因为纯定量指标可能遗漏领域特有问题。

在部署前，入选模型还必须完成集成测试：验证模型代码（通常会为部署而重构）能与更大的 IT 系统正确对接，并确保任何辅助代码（数据前处理与后处理）均实现完整的版本控制。

第六步：验证（确认）与发布

在受监管的部署场景下，ML 模型按 GAMP 验证生命周期进行发布。

编写验证计划，覆盖所有 AI 特有要素。独立测试（或确认）团队执行测试：在测试数据上复跑模型、检查可重复性，并在受控条件下确认模型输出落在预期范围内。尤为重要的是，此处须使用留出的确认数据集（既不用于训练也不用于调参）来确认”最终”模型性能。连续运行输出的任何波动，都必须处于允许的公差范围内。

确认通过后，AI/ML 子系统正式投产，并保留其版本记录、训练数据快照以及验证结果。

第七步：运行与持续变更管理

与静态软件不同，AI 系统在运行中往往随着新数据到来而演进。

Mintanciyan 等人建议开展持续监测：实时跟踪模型性能指标/KPI，以发现漂移或性能劣化。系统的自动控制或人工监督（罕见事件、离群点）须在性能跌出既定阈值时触发告警。

变更管理流程须能容纳周期性的模型再训练：为新数据开辟管线，并在发生重大新训练事件时对模型进行再验证。每一次再训练或微调周期都按”迷你项目”处理，具备其自有文件与风险评估，并遵循与上述相同的框架。

第八步：支撑性质量流程（风险、变更、维护）

全流程中，标准 GxP 流程须按 AI 特性进行调整。

风险管理是持续性的：团队须识别新场景（加速决策、针对模型的网络安全攻击），并补充相应缓解措施。变更控制须定义模型参数变更如何获批并形成文件记录。CAPA 流程也应纳入对数据管线问题的处置（如修正标注错误的数据）。

归根结底，正如一位作者所言，目标是在”文件夹让位于仪表板、管线与神经网络”的同时，依旧保有传统验证的精神——”适用于预期用途、保护患者、确保数据完整性”。

这一基于风险的框架综合了法规、ISPE GAMP 以及专家来源的指导意见。它与经典 CSV 一脉相承，但更强调数据治理、模型指标与监测。许多组织会结合自身情境进行定制，但以上步骤代表了业内正在形成的共识性最佳实践。

数据完整性与质量控制

与 GxP 原则一致，数据完整性是 AI/ML 验证的核心命题。ALCOA+ 范式——长期内嵌于 Part 11 与 Annex 11——被所有专家一致强调。Korrapati 的表述尤为直接：”确保可信赖的 AI……要求以对待任何受监管产品组成部分同等的严谨性来对待数据。”

具体而言，AI 全生命周期的每一个要素都是记录：原始传感器数据、训练数据集、标签、中间特征、模型参数以及最终输出，都必须记录在案、加盖时间戳并受到保护。以基于图像的质量控制为例，一张标注过的训练图像（用轮廓标出缺陷的 X 光片）就是原始记录，须归档保存。使用外部数据时，纳入之前须先核查权利与隐私（HIPAA/GDPR）。

数据质量控制意味着严格的预处理（清洗、归一化、去重）以及偏倚缓解。数据增强等高级做法，须作为方法学的一部分加以文件化。数据生命周期也要纳入管理：新数据流入的管道（如新批次测量数据）须遵循既定 SOP，并在变更控制下予以捕获。用于触发 ML 的异常输入（如某批次出现异常化学组成）应当引发 CAPA 级别的审查。

ML 验证还依赖稳健的数据划分。行业惯例（以及 GAMP D11 指南）是划分彼此独立的训练、验证与测试数据集，以避免信息泄漏：训练集（通常较大）用于学习；验证集用于指导超参数调优；测试集（完全隔离保存）仅用于最终评估。这确保了评估的是模型在未见数据上的真实表现。这种划分的完整性须严格守护——任何无意的复用（哪怕只是部分），将验证数据用于训练，都会使测试失效。

一个预测质量的案例揭示了辅助数据的重要性：为训练模型，须按时间戳与设备 ID，将水循环回路的传感器读数与实验室微生物计数对齐。为确保学到的模式（如污染事件发生前电导率的轻微上升）可靠有效，还需要开展稳健的数据对账。这再次印证：支撑 AI 可靠性的，是数据质量，而不仅仅是数据数量。

追踪数据完整性的控制手段与传统系统类似：对数据录入与转换设置审计追踪，对数据批准使用电子签名，并进行系统备份。但在 AI/ML 场景下，这些控制要落实到更细的颗粒度。新增或变更的 ML 模型实质上会生成新的数据工件；版本控制系统（如 Git）通常用于安全地捕获模型与代码变更。已部署模型版本的注册表或数据库，可供审计使用，类似软件发布注册表。

共识非常明确：如果数据管道不可信，任何 AI 都谈不上可信。对 AI 系统的监管审评，将以至少与代码同等严格的尺度审视数据处理。申办企业须确保数据治理政策（包括遵循 21 CFR 211 等数据完整性法规要求）明确覆盖 AI 项目的数据对象。

案例研究

GSK 疫苗数字孪生

GlaxoSmithKline 与 Siemens、Atos 合作，为一条疫苗生产线创建了数字孪生。这个虚拟模型从真实工厂接入实时传感器数据（温度、流量、pH 等），对工艺物理过程进行仿真，AI/ML 算法在运行过程中动态优化工艺参数。

该项目主要着眼于提升开发速度，但在 GMP 语境下落地时，仍须对数据流与仿真模型开展验证。Gfieder 等人（2023）指出，此类孪生系统须在真实工艺与模型之间建立界面定义清晰、并具备版本控制。GSK 采用了 GAMP 原则：明确该孪生系统的需求（可追溯到具体的在制过程控制），并将其输出与真实工艺数据对照测试以确保一致性——将模型验证与工艺验证融合在一起。

预测性水质（NTT Data 案例）

某制造工厂通过使用 ML 预测污染事件，改进了纯化水水质控制。传统的水质监测依赖每日实验室检测，反馈周期长。工程师手头有连续的传感器日志（TOC、电导率、温度、流量），于是构建了一个 ML 分类器，用于提前 24 小时预测微生物计数偏高的风险。

验证做法包括：将多年历史数据划分为训练集/测试集；将模型的预测准确性与实际实验室结果进行基准对比。这个案例说明两件事：其一，训练出有意义的模型，需要丰富且高分辨率的数据；其二，ML 能实现”加速问题发现”——更早识别异常——这一主题在行业文献中反复出现。只要数据管理到位，ML 就能把沉睡的工艺数据转化为前瞻性的质量控制工具。

质量管理体系（QMS）中的 AI

E-leap Software 描述了 AI 如何重塑质量监管。企业已开始将 AI 用于文件审查（用 NLP 检查批记录）、趋势分析（自动化 CAPA 风险评分），甚至用于包装的基于图像的检验。

监管方对 AI 增强的 QMS 持积极态度，前提是它能提升可追溯性与可审计性。有作者指出，AI”确保结构化数据完整性、可追溯性，以及随时可审计的流程”，这正是检查员所看重的关键属性。一个 AI 审查器可能比人工快 100 倍标记记录中的不一致之处，同时仍会记录其判定依据，从而进一步夯实法规符合性。试点此类工具的企业报告称效率显著提升——对话式 AI 通过指出检查员不易察觉的根因，降低了日常偏差。

生成式 AI 的监管审评

法规文件起草属于下游质量职能，生成式 AI 正在加速这一过程。近期一项研究发现，基于 GPT 的模型将药物警戒报告撰写工作量降低了约 50%。

审计人员如今会要求：任何用于受监管文件的生成内容，都须纳入验证/QA。由此，一些公司开始实施”AI 输出复核”检查清单：每一段 AI 生成的内容由 SME 复核；元数据（模型版本、提示词）被记录归档；同时运行抄袭检测以确保原创性——等同于在 LLM 使用场景下补齐 Part 11 控制。

影响、挑战与最佳实践

上述案例既展示了 AI/ML 在 GxP 中的巨大潜力，也揭示了其中的陷阱。

积极面： 预测型智能可显著提升质量。ML 获得的洞察以数据为驱动，更加主动，将合规从”出了问题再补救”推向”事先布控、预防为先”。真实项目已实现更早发现偏差（如水质变化）、在海量数据中实现异常的自动检测，并通过数字孪生加速工艺放大。ROI 也颇具吸引力：有分析报告称，监管文档工作量减少约 50%，70–80% 的常规分析任务实现自动化。

挑战面：

可解释性与信任。 AI 模型可能不透明。缺乏清晰的决策路径（”黑箱”）使得失败决策难以自圆其说。监管方强调人工监督与透明性。一种做法是尽可能使用可解释模型（如决策树），或在采用深度网络时叠加解释层（LIME、SHAP）。另一种做法是为输出补充置信度评分，让低置信度情形触发人工复核。文档记录不仅要写清模型是否通过测试，也要写明专家如何理解其决策依据。

数据偏倚与代表性。 AI 的上限取决于数据。带偏的训练数据（如关键批次条件采样不足）可能引发不安全行为。初始风险评估须纳入”偏倚风险”以及人群或运行层面的包容性。缓解措施包括：构建多样化训练集、开展偏倚检测测试，并持续监测数据子人群中模型的非预期行为。

资源投入。 构建并验证 AI 系统往往需要专门人才（数据科学家、ML 工程师）及算力资源，与对现成软件更为直接的验证形成对比。中小企业可能难以具备这些资源，因此 ISPE 强调须重视用户-供应商协议以及具备资格确认的 AI 工具供应商。最佳做法是：受监管企业应尽早让懂 AI 的质量保证人员介入，并参与行业工作组以共享经验。

持续生命周期。 传统系统验证通常在上线后收尾，仅做周期性的资格确认。AI 系统则需要持续警惕：新一批数据就可能让模型表现一夜之间发生变化。维持合规意味着必须将”生产环境再训练”视为正式的受监管变更，并为再验证设定并记录触发条件。不少建议提出，将模型维护节奏与常规产品回顾对齐。

行业最佳实践：

基于风险的优先级排序。 按关键性对 AI 系统分类。高影响用途（如控制无菌工艺）须开展完整的 GxP 验证；低影响用途则可采用更轻量的监督。这种按比例的做法在 CSA 指南中亦被倡导。

强化文档。 将验证文档模板扩展到 AI。验证计划须列出 AI 特有活动（数据选择、模型版本管理），测试计划也须加入旧模板中没有的”模型性能测试”和”偏倚检查”。一些组织还会新增文档类型（如 Model Performance Qualification Protocol）。关键在于确保所有 AI 流程可追溯、可复现。

跨职能能力。 AI 验证要做得成功，往往需要跨学科团队（IT、质量、SME、数据科学家）协同。尽早为数据科学家开展 GxP 概念培训（反过来也为 QA 人员提供 ML 培训）至关重要。知识共享平台（如 ISPE AI SIG）正在形成，以加速经验扩散。

技术控制。 尽可能落实透明性：配置模型记录不仅是输入，还包括中间决策评分；采用”设计即支持审计记录”的工具链；尽可能使用开放标准（如 ONNX），以避免供应商锁定，并便于第三方审查。

监测工具的使用。 模型监测工具（漂移检测器、异常追踪器）须成为系统组成部分，这类似于在工厂里加装报警。一些供应商提供内置审计追踪的 MLOps 平台——善用此类工具可减轻合规负担。

未来方向

监管与技术格局都在演进，以更好地容纳 AI/ML。

监管层面： 各机构正积极研究 AI 的识别与治理。FDA 已试点开展 AI/ML 监测项目；ICH/PIC/S 预计将在未来几年发布聚焦于制药领域 AI 的专题指南。EU AI Act 将引入新的法律要求（如对高风险 AI 开展第三方审计），并将与 GxP 合规工作交织叠加。各组织须密切关注这些动向，并准备将其融入自身的 GxP 系统（如按 EU AI Act 设想准备 Technical Documentation）。

标准层面： ISPE GAMP AI Guide 以及未来 PIC/S 关于 AI 的 GPG 将提供迫切需要的具体细则。技术标准（如用于 AI 管理体系的 ISO/IEC 42001）也可能影响对质量体系审计的预期。CSA 将成为常态：监管方更希望看到企业把”质量源于设计”内建到 AI 中，而不是用没完没了的测试来证明。

技术层面： 联邦学习（在去中心化数据源之间训练模型）的采用，会给可追溯性与验证带来独特挑战。生成式 AI 工具将作为决策辅助被集成进来；企业须明确”经验证的软件”与”智能辅助工具”之间的边界应画在哪里。AI 的成熟应用很可能让验证更敏捷：持续部署叠加自动化测试流水线，可能会模糊开发与生产的界限，从而要求形成新的、符合 GxP 的 DevOps 实践。

现在就以严谨方式验证 AI/ML，企业不仅能确保合规，也能推动向数据驱动质量的文化转型。多位专家强调，批判性思维与专家判断仍是关键——工具可以被验证，但必须由受过训练的专业人员进行监督。

结论

在 GxP 监管的制造活动中引入 AI/ML，需要把前沿技术与历久弥新的质量原则融为一体。

综述发现：AI/ML 验证带来了新的工作内容（数据整理、模型训练周期、持续监测），但完全可以纳入建立在既有框架之上的、基于风险的全生命周期方法之中。关键在于，所有相关方——监管机构、行业科学家与技术提供方——都一致认为目标并未改变：系统必须满足预期用途，确保患者安全，并维护数据完整性。

通过将控制措施（审计追踪、变更管理、数据治理）延伸覆盖 AI 产物，并把验证工作聚焦在风险最高的环节，企业便能在制造中负责任地应用 AI/ML。来自 ISPE、FDA 及行业思想领袖的出版物指出，从业者无需”重新发明轮子”，而应在现有良好实践基础上因势利导、灵活调整。

GAMP 5 附录 D11 与新版 AI 指南明确将 AI 系统与大家熟悉的 GxP 全生命周期关联起来。案例（预测性水质与数字孪生）也展示了：只要验证做得严谨到位，就能把实际收益落到实处。展望未来，组织须持续跟踪不断演进的监管期望（PIC/S、EU AI Act），并投入资源，在 GxP 团队中系统提升 AI 素养。过去一年对 CSA 与 ALCOA+ 的关注，为此奠定了坚实基础。

生成式 AI 及其他先进工具能够在运营上”带来显著提升”——但前提是必须得到良好治理，并经过恰当验证。

在 GxP 制造中验证 AI/ML，既可行，也必不可少。这需要一套严谨、可文档化的流程，与既定的质量风险管理保持一致，同时针对学习型系统的特殊性加以扩展。遵循本文所述原则与实践，企业即可确保其 AI/ML 项目既具创新性，又符合法规要求。

外部来源

[1] https://www.bioprocessonline.com/doc/trust-but-verify-validating-ai-in-pharma-s-gxp-world-0001
[2] https://quality.eleapsoftware.com/ai-in-the-pharmaceutical-industry-how-artificial-intelligence-is-transforming-quality
[4] https://fliphtml5.com/yhqkx/anmm/ISPE_GAMP_5-2022/
[5] https://intuitionlabs.ai/articles/generative-ai-gxp-validation-part-11
[6] https://www.gsk.com/en-gb/behind-the-science-magazine/digital-twin-using-advanced-technology-to-accelerate-vac
[7] https://nttdata-solutions.com/bnl/blog/machine-learning-for-pharmaceuticals-blog-series-part-2/
[14] https://ispe.org/pharmaceutical-engineering/september-october-2025/new-gampr-guide-addresses-challenges-posed
[22] https://ispe.org/pharmaceutical-engineering/july-august-2024/artificial-intelligence-governance-gxp-environments
[23] https://intuitionlabs.ai/articles/21-cfr-part-11-it-compliance-guide

GxP

This post is licensed under CC BY 4.0 by the author.