绘制区间删失数据的生存曲线_r语言将删失数据中的寿终数据顺序排列

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

爱笑的小刀 · python绘制概率密度曲线 - CSDN文库· 1 月前 ·

活泼的草稿本 · 找银行借了395个亿买下万科深圳地铁合规吗？· 1 月前 ·

慈祥的仙人掌 · 用户登录介绍_手机银行_服务介绍_个人电子银 ...· 2 月前 ·

温柔的椰子 · Black Duck Community· 2 月前 ·

性感的小蝌蚪 · 如何使用Tapdata Cloud ...· 3 月前 ·

上图是单纯放疗组的乳腺癌研究。左图:用R包Icens获得的累积分布函数的NPMLE。右图:生存函数的NPMLE，附加了用R包icensBKL获得的分段线性生存曲线的假设。

区间删失数据下，生存函数S(t)的非参数最大似然估计(NPMLE)，也称为Turnbull生存函数S(t)的估计量。

与Kaplan-Meier估计量相反，区间删失数据生存函数S(t)的NPMLE一般没有显示解，必须通过迭代算法获得。一个例外是case I 的区间删失数据(当前状态数据)的分析解是可用的(Robertson等人，1988)，但是没有被任何SAS或R程序使用。

代码的一部分：安装相应的包

install.packages("BiocManager")
BiocManager::install("Icens")
install.packages("devtools")
library(devtools)
install_github("cran/icensBKL") 
library(icensBKL)

代码第二部分：绘制生存函数图

#数据准备
data("breastCancer", package="icensBKL")
breastR <- subset(breastCancer, treat=="radio only",
                   select <- c("low", "upp"))
breastR[is.na(breastR[,"upp"]), "upp"] <- 99
breastR[is.na(breastR[,"low"]), "low"] <- 0
#绘制区间删失数据的分布函数
NPMLE <- EMICM(breastR)
print(NPMLE)
plot(NPMLE, ylab=expression(hat(F)(t)), main="")
#绘制区间删失数据的生存函数
NPMLE2 <- icsurv2cdf(NPMLE)
print(NPMLE2[1:5,])
plot(NPMLE2$time, 1-NPMLE2$cdf, type="l",
      xlab="Time", ylab=expression(hat(S)(t)), xlim=c(0, 53))
lines(c(48, 53), c(0, 0))

breastR是一个两列的data.frame，表示每个个体区间删失的左右端点。

使用EMICM（EM-iterative convex minorant algorithm）计算非参数极大似然估计(NPMLE）

关于EMICM函数的介绍如下：

网址： Icens: NPMLE for Censored and Truncated Data (bioconductor.org)

使用icensBKL包中的icsurv2cdf函数，将对象NPMLE(icsurv类)转换成数据框NPMLE2.

书：survival analysis with interval-censored data: a practical approach with exomples in R, SAS, and BUGS.

与Kaplan-Meier估计量相反，区间删失数据生存函数S(t)的NPMLE一般没有显示解，必须通过迭代算法获得。一个例外是case I 的区间删失数据(当前状态数据)的分析解是可用的(Robertson等人，1988)，但是没有被任何SAS或R程序使用。右图:生存函数的NPMLE，附加了用R包icensBKL获得的分段线性生存曲线的假设。区间删失数据下，生存函数S(t)的非参数最大似然估计(NPMLE)，也称为Turnbull生存函数S(t)的估计量。代码的一部分：安装相应的包。

生存分析用于研究被观察对象会在何时发生某个事件的问题，例如银行业务的预测、保险及零售行业客户下次购买时间等的预测。其结果变量是一个时间点到任何感兴趣事件发生的时间。另外还有风险函数。删除数据包括左删失、右删失、区间删失，用以确定时间范围。生存分析方法使用survival包，survminer包中的ggsurvplot()函数用于绘制生存曲线。Kaplan-Meier方法适用于数据量比较小的，Surv()函数用来创建生存对象，time\event为其两个参数。通过survminer包中的ggsurvpl

生存描述-描述不同时间的总体生存率，计算中位生存时间，绘制生存函数曲线，一般用Kaplan-Meier方法和寿命表法；生存曲线比较-比较不同处理组的生存率，一般用logrank检验；生存相关因素的分析：回归模型；由于logrank检验仅能分析一个因素，因此两个或者两个以上因素的分析需要使用Cox比例风险模型； 2、生存分析使用的方法： Kaplan-Meier plots

Bootstrap 区间是指通过Bootstrap重采样方法，通过对原始样本进行有放回抽样，生成多个新的样本集，然后通过统计分析这些新样本集的结果，得到参数的分布情况，并进一步计算置信区间。Bootstrap方法可以用来估计参数的置信区间，即参数的估计值的不确定性范围。通过Bootstrap方法，可以通过以下步骤计算置信区间： 1. 从原始样本中有放回地抽取一个样本，形成一个新的样本集。 2. 根据新的样本集计算所需的统计量，比如均值或中位数。 3. 重复进行步骤1和步骤2，生成多个新的样本集，并计算相应的统计量。 4. 根据生成的统计量的分布情况，计算置信区间，一般常用百分位法来计算置信区间的下限和上限。通过Bootstrap重采样方法，可以更好地估计样本的参数，同时考虑了样本的不确定性，进而提供了参数的置信区间估计。 Bootstrap方法在统计学和机器学习领域有广泛的应用，可以用于估计各种统计量的置信区间，进一步进行参数估计和假设检验。在实际应用中，Bootstrap方法可以帮助我们更好地理解样本数据的分布情况，从而更准确地进行数据分析和决策。123 #### 引用[.reference_title] - *1* *2* *3* [Bootstrap重采样进行参数估计 - 置信区间 ](https://blog.csdn.net/qq_33934427/article/details/124030782)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]