从人海战术到算法监查—一场已经发生却还未被充分理解的范式转移

图:基于AI的临床数据整合与可视化平台(来源: 数野科技-AI- RBQM平台)
2025年初, 某三甲医院临床试验中心。 一位资深CRA(临床监查员) 提着笔记本电脑和厚厚的监查清单走进了病案室。 她的办公桌上堆着10位肿瘤受试者最近一个月的诊疗记录—大约1000页纸质病历和电子文档打印件。 按照每天核查30到40页的行业标准速度, 她需要连续工作25天才能完成这一轮的源数据核查(SDV) 。
然而,现实的种种限制让这个计划显得荒谬:这家热门的研究中心每6到8周只向外部监查员开放2天的现场预约窗口。 简单的算术告诉我们, 光是这10位患者的首轮数据核查, 如果不加干预, 就要拖上整整一年。 这意味着, 当她在核对第一次访视的数据时, 受试者可能已经完成了全部疗程。
这不是2005年的陈旧场景, 而是今天很多临床试验项目仍在经历的“数据堰塞湖” 。

失控的成本算术
长期以来,制药行业奉行一种看似稳妥实则昂贵的信条:只有逐字逐句核对每一条数据,才能确保试验质量。这种执念导致现场监查费用(包含差旅)长期占据临床试验总预算的 25%以上。 在复杂的肿瘤或免疫类适应症试验中, 随着适应性设计和生物标志物采样的增加, 数据产生量呈指数级增长。 当10位患者在4周内就能产生1000页源文件时, 依赖“人海战术” 进行地毯式轰炸的物理极限已被突破。
这不仅仅是效率问题,更是一个无解的数学问题。更讽刺的是,投入巨资维持的100% SDV并未能有效构建数据质量的护城河。 大量研究表明, 单纯的转录比对只能发现拼写错误或数值录入偏差, 却极难发现逻辑性错误、 造假模式或系统性的方案违背。 我们正花费巨资去纠正那些对药物上市审批无关痛痒的细节, 却可能对真正的风险视而不见。
监管的转向
监管机构比大多数企业更早意识到了不可持续性。早在2013年, FDA就首次推荐了基于风险的监查模式。 随后的十年, 是一场从“建议” 到“强制” 的渐进式改革。

RBQM是什么, 以及它不是什么
即使在今天,仍有不少从业者误以为RBQM就是“为了省钱而减少监查” 。 这是一个危险的误解。 RBQM的核心不是“少做” , 而是“聪明地做” 。
其底层逻辑建立在帕累托法则之上:并不是所有的数据点都生而平等。 Yamada等人在 2024年的研究中指出, 约80%的eCRF数据点属于非核心数据。 真正决定试验成败—即影响主要终点、 受试者安全及关键入排标准—的核心数据仅占20%。
RBQM通过设定质量容忍限(QTL) 和关键风险指标(KRI) , 配合中心化统计监查, 将原本撒胡椒面式的SDV资源, 精确制导投放到那20%的核心数据和高风险中心上。 罗氏(Roche) 曾公开过一个经典案例: 在一个大型项目中, 他们通过RBQM模式只对20%的研究中心实施了高强度的现场监查, 其余80%主要依靠远程手段。 结果令人震惊—这种模式发现的关键偏差反而增加了17%。

图:基于AI的RBQM 技术架构(来源: 数野科技-AI- RBQM平台)
数据驱动的监查长什么样
当一家现代化的制药企业部署了成熟的RBQM系统后, 监查流程会发生质的变化。 这不再是带着空白表格去现场填空, 而是一场基于数据的侦查。
EDC ( 电子数据采集) 数据、 系统生成的稽查轨迹( Audit Trail ) 以及质疑数据(Query) 等多源异构数据, 经过ETL处理后被喂给后台的统计引擎和机器学习模型。 系统会实时计算每个中心的“异常评分” 。 在KRI仪表盘上, 所有研究中心被映射为气泡图上的点, 颜色深浅代表风险等级。

图:基于AI的临床数据整合与可视化平台(来源: 数野科技-AI- RBQM平台)
当某个中心的数据分布开始出现统计学上的“漂移” , 或者某些受试者的不良事件录入时间模式出现异常(例如总是集中在周五下午录入) 时, 系统会自动发出预警。 此时, CRA才收拾行囊出发。 他们手中拿着的不再是通用的核查表, 而是一份精确到受试者ID和具体变量的“问题清单” 。 他们去现场不是为了寻找问题, 而是去核实算法已经发现的问题。
还没结束的革命
中国市场目前的RBQM发展阶段, 颇似美国2017年前后的情形—制度层面的绿灯已经亮起, 工具和技术也已就位, 但组织惯性和认知转变的爬坡才刚刚开始。
从数据来看,这场革命的回报是丰厚的。 ACRO的白皮书数据显示, 全面实施RBQM的项目, 关键数据错误减少了4倍, 数据缺页率下降了45%, 大型申办方从最后一名患者访视到数据库锁定的时间平均缩短了10天以上。 这些数字背后, 折射出的是一种更根本的认知升级: 临床试验的质量不是事后核查出来的, 而是从设计阶段就通过风险控制“预埋” 进去的。 这场从人海战术向算法监查的范式转移, 大幕才刚刚拉开。
作者:超能文献|Suppr.wilddata.cn