快上网专注成都网站设计 成都网站制作 成都网站建设
成都网站建设公司服务热线:028-86922220

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

如何用R语言进行Cox回归生存分析

本篇内容介绍了“如何用R语言进行Cox回归生存分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

成都网站建设哪家好,找创新互联公司!专注于网页设计、成都网站建设公司、微信开发、微信小程序开发、集团成都定制网站等服务项目。核心团队均拥有互联网行业多年经验,服务众多知名企业客户;涵盖的客户类型包括:成都混凝土搅拌站等众多领域,积累了大量丰富的经验,同时也获得了客户的一致称誉!

在生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下

cox proportional hazards regression model

称之为cox等比例风险回归模型, 对应的公式如下

如何用R语言进行Cox回归生存分析

将上述公式进行log转换,可以变换成以下格式

如何用R语言进行Cox回归生存分析

这个公式和逻辑回归的公式就非常的接近了, cox回归其实是在线性回归和逻辑回归的基础上延伸而出的一种方法,将影响生存的多个因素当做回归方程中的自变量,将风险函数h(t)和h0(t)的比值当做因变量。

每个自变量对应的系数,如b1,b2这类的 ,称之为偏回归系数。当偏回归系数大于0时, 随着该自变量值的增加,风险增加,生存时间减少,当系数小于0时,则相反;等于0时,没有影响。

将exp(b)称之为hazard ratio, 简称HR。将偏回归系数转换成HR, 对应的关系如下

  1. HR = 1, 没有影响

  2. HR > 1,   风险增加

  3. HR < 1,   风险降低

在临床上,将HR>1的自变量称之为坏的预后因子,将HR<1的自变量称之为好的预后因子。通过survivalR包,可以轻松的实现cox回归分析,步骤如下

1. 准备生存数据

对于每个个体而言,其生存数据会出现两种情况,第一种是观测到生存时间,通常用1表示,第二种则是删失。通常用0表示。survival自带了一个测试数据lung, 内容如下所示

如何用R语言进行Cox回归生存分析

每一行代表一个样本,time表示生存时间,status表示删失情况,这里只有1和2两种取值,默认排序后的第一个level对应的值为删失,这里则为1表示删失。其他列为样本对应的性别,年龄等基本信息。

2. cox回归分析

代码如下

如何用R语言进行Cox回归生存分析

可以看到,cox回归的适用范围更广,以最后一个回归分析为例,结果如下所示

如何用R语言进行Cox回归生存分析

首先查看likehood ration test , wald test, logrank test三种检验方法的p值,p值小于0.05, 这个回归方程是统计学显著的。说明在这么多自变量中包含了对生存时间具有影响的因素。

然后查看每个自变量的p值,可以看到sex和ph.ecog这两个变量的p值小于0.05,而age的p值大于0.05, 说明sex和ph,ecog这两个变量对生存时间的影响更加显著。

最后查看自变量的coef等指标,coef就是偏回归系数,exp(coef)就是HR。sex的HR值小于1,该数据集中1=male, 2= female, HR表示的是数值大的风险/数值小的风险,在这里就是female/ male, 说明female死亡的相对较低。HR的值约为0.58, 说明female的死亡风险只占了male的58%, 相比male, female的死亡风险降低了42%。ph.ecog的HR值大于1, 说明随着ph.ecog数值的增加,死亡风险会增加。

3. 结果可视化

sex为例, 可视化的代码如下

如何用R语言进行Cox回归生存分析

效果图如下

如何用R语言进行Cox回归生存分析

“如何用R语言进行Cox回归生存分析”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!


文章名称:如何用R语言进行Cox回归生存分析
文章起源:http://6mz.cn/article/jigoci.html

其他资讯