如果不让大家知道SEER数据库的临床预后模型这么火热，我会伤心的

大家好，这里是SEER数据库专栏，我是布涵棠。

上一期文献导读|想不到，SEER数据也玩“新瓶装旧酒”的“噱头”开篇与大家分享了SEER数据【新瓶】与临床研究常用的统计分析方法【旧酒】“碰撞”后会带来什么样的滋味呢？

预后研究中经典的统计分析方法，包括Kaplan-Meier生存曲线、Log-rank test、cox回归。使用这些方法分析得到阳性结果后，不就可以了吗？

但对一名医生来说，如果具备预测患者是否会发生某种结局的能力，那么很多医疗实践模式或临床决策会因此改变。

比如，如果我们能够预测某个患者术中可能发生大出血，那么我们一定会在手术过程中小心翼翼并备有充足的血液制品供患者使用。

显然，上述的统计分析方法无法满足日益增长的临床应用需求，此时，为方便临床应用，研究者常将不同的预测因子的取值赋予不同的评分，最终的累计得分对应一定的事件概率，即评分-概率对照表, 或依据得分高低划分高危和低危人群，以便临床干预治疗，这就是我们今天的主角：临床预测模型。

临床预测模型，又称临床预测规则、风险预测模型、预测模型或风险评分，是指利用数学公式估计特定个体当前患有某病或将来发生某结局的概率。临床预测模型包括诊断模型和预后模型。

目前基于SEER数据库发表的文章中，临床预后模型占据了主流地位。

预后模型关注的是在当下健康状况（健康或患病），未来一段时间内发生某结局（发病、复发、死亡，伤残及并发症）的概率，多见于队列研究。

简单的说，就是通过构建多因素回归模型（常用如Cox回归），根据模型中各个影响因素对结局变量的贡献程度（回归系数的大小），给每个影响因素的每个取值水平进行评分。

然后再将各个评分相加得到总评分，最后通过总评分与结局事件发生概率之间的函数转换关系，从而计算出该个体结局事件的预测值。

今天和大家一起拆解一下SEER数据与临床预后模型相结合的套路

与大家分享一篇2022年发表于ADVANCES IN THERAPY（IF=3.845）题为 “Prognostic Nomogram for Overall Survival in Small Cell Lung Cancer Patients Treated with Chemotherapy: A SEER-Based Retrospective Cohort Study“---基于SEER数据库构建临床预测模型的文章。

文章宏观要素分析

从题目中我们可以得到研究的类型是“预后型研究”，人群为“接受化疗的小细胞肺癌患者”，预测变量Y是“总生存期（Overall Survival，OS)”。

研究对象（P）：2004年至2015年期间经病理诊断的小细胞肺癌患者；所有患者均接受过化疗

结局指标（O）：总生存期（Overall Survival，OS)

研究类型（S）：回顾性队列研究

研究目的：为接受化疗的小细胞肺癌患者这一人群“量身定制”预后诺模图

研究背景

小细胞肺癌（small cell lung cancer, SCLC）具有临床进展快、预后差的特点。尽管对初始治疗高度敏感，但大多数小细胞肺癌患者最终会产生耐药性，5年存活率不足7%。

除TNM分期系统外，SCLC 的分期一直沿袭美国退伍军人肺癌协会（The Veterans Adiministration Lung Study Group’s，VALG）的二期分期法，分成局限期（limited-disease small cell lung cancer, LD-SCLC）和广泛期广泛期（extensive-disease small cell lung cancer, ED-SCLC）。

局限期：I至III期(T any，N any，M0)。

广泛期：IV期(T any，N any，M1a/b)。

研究流程图

该研究纳入了2004-2015年期间共7865例小细胞癌患者，通过设置排除标准，最终纳入4971例具有明确分期的小细胞肺癌患者，且所有患者均接受过化疗。

由于局限期（limited stage ，LS）和广泛期（extensive-stage，ES）的小细胞癌患者诊疗模式和预后差异悬殊，该研究采用相同的研究方法分别构建了局限期（LD-SCLC）和广泛期（ED-SCLC）两个预后诺莫图（nomogram）。

纳入排除标准制定

纳入标准

①2004年至2015年间经病理证实的小细胞肺癌；

②接受过化疗的患者。

排除标准

①人口统计学信息不完整，如婚姻状况、年龄、性别、种族；

②临床病理信息不完整，如肿瘤大小、肿瘤分期(TNM-stage)、肿瘤分级；

③手术和放射治疗信息不完整；

④生存状态和随访数据缺失。

研究结果

基线资料

红色框内显示的是局限期（LD-SCLC）这一人群基线资料分布。

我们可以看到，研究纳入的变量包括：年龄、性别、种族、婚姻状态、T分期、N分期、M分期、分级、肿瘤大小、偏侧、原发肿瘤部位手术治疗（SPS）和放射治疗。

人群：4971例小细胞肺癌

分期	局限期（LD-SCLC）	广泛期（ED-SCLC）
例数	1759例	3212例

以局限期（LD-SCLC）这一人群为例，和大家梳理一下文章的分析思路

分组：按7：3的比例将1759例局限期（LD-SCLC）患者随机分成训练集（n = 1232例）和验证集（n=527）。

总生存期（Overall Survival，OS)：从癌症诊断之日到登记处报告的死亡日期之间的时间间隔。

单因素和多因素COX比例风险模型

训练集（Training set）

进入单变量COX比例风险回归模型的变量有：种族、年龄、性别、婚姻状况、T分期、N分期、肿瘤分级、肿瘤大小、肿瘤偏侧性、原发肿瘤部位手术治疗（SPS）和放射治疗。

下图展示的是常规Cox回归结果的森林图。主要体现了变量、病例数、HR值和P值。

比如:年龄这一变量，分成了＜60岁和＞=60岁两组，296例患者年龄小于＜60岁，936例患者年龄＞=60岁。中间竖的虚线是无效线，代表HR值等于1。

文章结果解读：

在本研究中，年龄以＜60岁组作为参考（reference），＞=60岁组位于无效线右侧，说明与＜60岁组相比，＞=60岁组有助于事件（这里特指死亡事件）发生，是预后不良因素。

多因素Cox回归分析进一步证实年龄、N分期、放射治疗是影响局限期（LD-SCLC）患者OS的独立预后因素。

构建预测模型

基于多因素COX回归的结果，除了发现影响局限期（LD-SCLC）患者OS的独立预后因素之外，还可以用来构建临床预后模型。

这个时候需要提到COX回归结果中一个参数，即回归系数（regression coefficients，coef），有时也叫做beta值，它和风险比（hazard ratio，HR）之间的关系是：

exp(coef)=HR

coef值小于0说明HR值小于1，说明变量是预后有利因素；

coef值大于0说明HR值大于1，说明变量是预后不良因素。

临床预后模型中计算的风险评分，就是根据多因素COX回归分组中各个影响因素对结局变量的贡献程度（回归系数的大小），给每个影响因素的每个取值水平进行评分，然后再将各个评分相加得到总评分：

Risk score = coef_X1×X1+coef_X2×X2.....coef_Xn×Xn

^{coefX1代表第1个变量的回归系数，X1代表第一个变量的赋值，coefXn代表第n个变量的回归系数。}

但是在临床应用中，诺莫图（nomogram）在实现结果可视化方面明显优于上述公式。

如下图，通过计算与每个变量相对应的评分累加得到总评分，来预测N局限期（LD-SCLC）患者1、2、3年的生存概率。

文章结果解读：

如果患者具有以下特征（图中红色圆点和红色实线）：

年龄＞=60岁+原发肿瘤部位接受过手术治疗（SPS：YES）+N0+放射治疗（Radiotherapy：None/unknown），总评分1.22，那么该患者生存时间＜12个月的概率是32.3%，该患者生存时间＜24个月的概率是58.7%，该患者生存时间＜36个月的概率是70.2%。

预测模型评估

模型评估：这篇文章建立的预测模型，从区分度、校准度、临床适用度这3个维度进行了预测模型的评估。

区分度：时间依赖性ROC

ROC曲线常用来评估某个因素/某个模型预测结局发生的准确性。

准确来说，是评估某个方法/某个模型将结局事件判别为发生/不发生的能力，也就是判别能力（区分度）；

因为生存资料的结果涉及生存状态和生存时间两个变量，所有不能用常规ROC曲线。

采用时间依赖性ROC更加适合，可以评估这个模型预测不同时间点结局发生的情况。

文章结果解读：

时间依赖的ROC曲线中，LS-SCLC患者的曲线下面积(AUC)分别为1年(0.89)、2年(0.81)和3年(0.79)，表明该预测模型预测1、2、3年的预后结局都具有较好的判别能力。

校准度：校准曲线（calibration plot），反映预测模型对患者OS的预测与实际观察之间的一致性

图的横坐标是预测概率：用预测模型对事件发生的可能性（Probability）进行预测，0到1表示发生事件可能性是0到100%。

纵坐标是实际概率：患者实际的事件发生率。

虚线线是拟合线，表示预测值对应的实际值。

如果预测值=实际值，则蓝色实线与参考线（虚线）完全重合；

如果预测值>实际值，即高估了风险，则蓝色实线在虚线上面；

如果预测值<实际值，即低估了风险，则蓝色实线在虚线上面；

文章结果解读：

校准曲线（calibration plot）：1、2、3年总生存率校准曲线与理想的斜率为1的直线拟合良好，提示预测模型预测值和实际值之间具有较好的一致性。

临床适用度：决策曲线分析（decision curve analysis，DCA）

建立好预测模型之后，我们已经采用了时间依赖性ROC计算得到AUC，从数据上肯定了模型的判别能力。

而在临床上，还需要考虑患者通过这个模型的使用是否可以受益。因为在临床工作中，如果不用预测模型对患者的情况进行评估，那么会出现2种极端的情况。

一是，所有患者都不接受额外干预，那患者不会有额外获益，是一种自然情况；

二是，所有患者都预估为“会发生结局”，此时都接受额外的干预，那么此时医疗系统需要付出“成本”，而部分患者也会因此“获益”。

此时，决策曲线分析（decision curve analysis，DCA）将很好地评估我们使用这个预测模型的临床获益是否大于两种“极端情况”,如下图。

y 轴代表的是净收益，x轴代表的是阈值概率，在DCA中，两条实线代表了两种极端的情况，分别是：

代表Treat none黑色线条：未使用预测模型，所有患者不进行额外干预，净获益为0。

代表Treat all斜的黑色实线：未使用预测模型，所有患者都进行干预，净获益是个斜率为负值的反斜线。

当然我们也可以简单粗暴的看这张图，只要模型 A 和模型 B 在两条实线的外侧就说明这个模型在临床上是值得被应用的。

文章结果解读：

将预测模型的临床净收益与TNM分期系统进行了比较，预后诺莫图的净收益大于“全（All）”或“无（None）”以及TNM分期3个场景中的净收益。

对于2个及2个以上模型的DCA曲线比较，比如本文的TNM分期，代表预后诺莫图这条虚线离这两条实线和TNM分期这条虚线越远，说明其有应用的价值。

构建风险分类系统（risk classification system）

基于每个小细胞肺癌患者的风险评分建立风险分类系统（risk classification system），局限期（LD-SCLC）分成高危组（High risk）(n=229)和低危组（Low risk）(n=298)，绘制绘制Kaplan-Meier曲线。

Kaplan-Meier曲线直观地表现出两组的生存率。因为生存数据往往都是非正态分布，因此常搭配log-rank检验进行统计推断。

两组的log-rank检验p值<0.0001，说明低危组（Low risk）相对高危组（High risk）可以减少死亡风险，提高生存时间，且差异具有显著性。

之后就采用验证集（Validation set）进行预测模型的内部验证，分析方法和上面的一致的。

全文总结

通过模块的拆解，分析了临床预测模型构建和评估的最原始方式。

包含了基于多因素COX回归构建临床预测模型，诺莫图（nomogram）进行结果的可视化，接着进行预测模型评估，分别从区分度、校准度、临床适用度这3个维度进行分析。

临床预测模型已经被我们揭开了神秘的面纱，像个娇羞的花儿，那么接下来，应该？

临床预测模型：翻我，翻我牌子，快来学习～

参考文献

1.谷鸿秋, 周支瑞, 章仲恒,等. 临床预测模型:基本概念、应用场景及研究思路[J]. 中国循证心血管医学杂志, 2018, 10(12):4.

2.Gu Hongqiu, Wang Junfeng, Zhang Zhongheng,等. 临床预测模型:模型的建立[J]. 中国循证心血管医学杂志, 2019, 011(001):14-16,23.

3.Wang Junfeng, Zhang Zhongheng, Zhou Zhirui,等. 临床预测模型:模型的验证[J]. 中国循证心血管医学杂志, 2019, 11(2):4.

4.《临床预测模型构建方法学》

—

END

—

撰文丨布涵棠

审核丨Epione老师

责编丨小张老师

往期推荐

继续阅读

阅读原文

如果不让大家知道SEER数据库的临床预后模型这么火热， 我会伤心的

如果不让大家知道SEER数据库的临床预后模型这么火热，我会伤心的