科技·前沿|生存+结果,临床为什么经常用这种分析方法?
2020-06-04 18:16:00 · 北京医准智能科技有限公司

满篇干货,开启临床科研新方式!

临床研究中,有时候我们关心的临床结局是一个事件,例如:死亡,疾病复发,怀孕,疾病痊愈等,很多情况下,我们不仅关心事件发生与否,也关心事件发生的早晚。同时,由于研究有周期限定,患者依从性有差异,不可能追踪到所有有结局事件的发生。这样的数据分析就被称为生存分析。

生存分析(survival analysis),即“事件史分析(time to event analysis)”,是既考虑结果又考虑生存的一种统计方法。其中,Kaplan-Meier法是其中最常用的描述终点事件/生存结局发生情况的有效手段。

例如:

肿瘤复发

携带HIV患者发展为AIDS的时间

孕妇的怀孕时间 (孕期长短);

机器从使用到报废的时间

优秀模型的建立是医疗AI科研和临床应用中最大的难点,

 

常见术语:

initial event(起始事件):反应生存时间起始特征的事件,如疾病确诊,某种疾病治疗开始;

survival time(生存时间):从规定的观察起点到某一特定终点事件出现的时间长短;  

failure time(失效时间):也称为死亡事件、终点事件。指随访研究过程中,一部分研究对象可观察到死亡、可以得到准确的生存时间,提供的信息是完全的;

probability of death (死亡概率):表示某时间段内存活的个体,在该时间段内死亡的概率。

 

用来干什么?

某个特定人群在某段时间内的平均寿命:例如中国1980 年出生的人,能够生存到 20岁,40 岁,100 岁的概率是多大?

 

估计两组或多组人群由于疗法差异导致的存活时间差异: 某种新疗法对于同时被诊断为相同程度肺癌的患者,和标准疗法相比是否能有效延长其生存时间?

 

研究多种变量 (e.g., 体重,年龄,性别,吸烟,饮食等) 和事件发生时间长短之间的关系: 例如收集健康对象,研究其体质指数 (BMI) 和最终发生II型糖尿病几率之间的关系。

 

预测患者的存活几率: 肺癌患者确诊后的 5 年、10 年生存率的推算。

删失数据(censoring,截尾数据)

在限定的观察期内,一些观察对象由于某种原因未能观察到终点事件发生,并不知道其确切生存时间,如病人生存时间未达到规定终点就像被截尾一样,称为删失数据 (censored)。根据原因不同分为以下几种情况:

研究结束时终点事件尚未发生(例如,死亡);

 

失访 (loss to follow-up): 无论是干预型,还是观察性实验,往往有观察对象中途失联,或改变主意退出;

 

死于其他原因 (death from other causes): 比如一项研究只关心吸烟与死于肺癌的时间长短的关系,但某些患者死因并非肺癌时 (自杀,车祸等);

 

由于严重药物反应而终止观察或改变治疗措施。

上述几种类型的删失数据,被叫做右侧删失数据 (right censoring),在分析中不能被删除,不管是何种类型的删失,事件都是事先未知、无信息的。

地图的截图

描述已自动生成

Figure 1. Survival times and censoring times in days.

相对应的,有左侧截尾数据(left-truncation),也叫做延时进入 (delayed entry),是由于研究对象入组研究的年龄各不相同,需把入组之前的生存时间考虑进来,这也是一种生存偏倚现象。

Kaplan-Meier法

Kaplan-Meier法是非参数分析法,又称乘积极限法(product-limit estimate),不必对生存时间进行任何参数分布的假设(parametric assumption),是一种单因素的生存分析,可以直观的反映不同情况下患者的生存差异,适用于小样本。

术语符号:

表示反应变量,≥0

生存方程为

图片包含 游戏机, 物体, 钟表

描述已自动生成

手机屏幕的截图

描述已自动生成

生存方程给出了研究对象会存活至时间的可能性;

 的范围从0到,生存方程有如下特性:

非增量;

时,,即活过时间0的可能性为1;

时,,即时间趋于无穷大时,生存曲线趋于0.

 

理论上来讲,生存曲线是平滑的,实际中,事件发生是以离散事件为度量的(天,周,等等)

风险函数,,表示在无先例时某事件发生的即时生存概率:

累计风险描述的是到时间t累积的风险值,

图片包含 游戏机, 画

描述已自动生成

手机屏幕截图

描述已自动生成

若我们知道中任一函数,可以推导出其它2个:

手机屏幕截图

描述已自动生成

生存数据

那么怎么样记录并呈现有删失的生存数据呢?

表示第个对象的反应时间

表示第个对象的删失事件

表示事件预估值

手机屏幕截图

描述已自动生成

观察值为卡通人物

描述已自动生成

 

一些文字和图片的手机截图

描述已自动生成

非参数预测

若无事件删失,非参估计量,其中经验累积分布函数。

当有观察值删失,可以运用Kaplan-Meier法乘积极限估计

Table 1. Kaplan-Meier estimate for patients in Figure 2.

手机截图图社交软件的信息

描述已自动生成

地图的截图

描述已自动生成

Figure 2. Plots of Kaplan-Meier product limit estimate of survival of a group of patients receiving ARV therapy.

Kaplan-Meier在计算生存率过程中充分利用了删失数据提供的不完全信息,虽不知病例会在何时发生终点事件,但至少知道在随访时间段内病例是没有发生终点事件的。

 

正如本文所说,缺乏数据的处理能力是制约医生进行科研的重要原因,而医疗AI行业的模型建立也需要专业知识及丰富的临床数据,因此如果医生能够自主应用AI进行临床研究,将是最高效最安全的解决方式,这就要求医院或科室需要一个属于自己的AI科研平台,医准智能早在2019年便推出达尔文智能科研平台,在安全性、易用性和领先性上都表现优异,目前已助力数十家医院进行临床研究,全面满足医生的科研需求。

 

文章中提到的生存分析功能也同样搭载在达尔文科研平台中,可用于疾病或治疗方案的预后研究。用户上传记录的生存数据,运用平台提供逻辑回归、Cox回归、Kaplan-Meier法、生命表等参数化或非参数化的统计模型进行分析。达尔文平台中还内置了前沿的机器学习生存分析方法,如生存树、随机生存森林、朴素贝叶斯、支持向量机等,供用户灵活选择。

 

如果您有相关临床研究难题,欢迎与我们联系,医准智能达尔文智能科研平台将帮助您把医疗问题转化为算法问题,零距离接触AI,实现与临床工作无缝对接。

 

向下 回顶部