R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制

2023-05-16

R语言|4. 轻松绘制临床基线表Table 1 regular table regular

欢迎关注公众号
第四次考核 Jimmy 学徒考核 Linux安装软件 rnaseq上游分析-2 ascp kingfisher数据下载ena (qq.com)https://mp.weixin.qq.com/s?__biz=Mzg2NDcxMzYwNg==&mid=2247483760&idx=1&sn=dccdb31eba73a0f1330f5e78d1de1bf7&chksm=ce646f99f913e68feb1d69c137c8ebbac24d8b79f5f4c172556af5f7b34e2f36189aaffbd2b5&token=2005279620&lang=zh_CN#rd 2021-01-29 11:00

Table 1是总结研究样本中变量组成及变量间关系的一张表。

R语言可以通过几行代码快速生成Table 1。

本期用到的是“tableone”，是我制作Table 1时最喜欢用的包，今天分享给大家，觉得有用的小伙伴希望多加点赞转发支持。

一.文献中的Tabl 1

二. tableone包制作Table 1（2列）

三. tableone包制作Table 1（4列）

四. tableone包制作Table 1（5列）

五. tableone其他代码展示

一

文献中的Table 1

图片来自：https://www.jianshu.com/p/3328fd0689f2

连续和分类变量相关性检验详见之前文章：

R语言|2. 连续变量相关性比较和 R语言|3. 分类变量检验

1-1. 变量名+总人群（两列）

研究目的为“xx疾病的预后因素分析”时常用，即不涉及比较。

这种表只需把握好连续变量为正态还是非正态分布即可。正态分布写均值±标准差，非正态分布写中位数+上下四分位数。

分类变量写数目和百分数。

例：研究某类型乳腺癌的预后，所以Table 1两列

参考文献：Lewis GD，et al. Prognosis of lymphotropic invasive micropapillary breast carcinoma analyzed by using data from the National Cancer Database. Cancer Commun (Lond). 2019 Oct 21;39(1):60.

1-2：变量+某变量分列+p值

研究目的为 “xx变量对预后的比较分析” 时常用。

因涉及比较，所以在Table 1常将用该变量将全部人群分为几类，观察其他变量在这几个分类中是否有差异（p值）。

这种表就涉及到了连续变量和分类变量的相关性检验，这两种检验在R语言|2. 连续变量相关性比较和 R语言|3. 分类变量检验已有介绍。

下面这篇文章的目的是研究两种病理类型的乳腺癌临床病理特点的比较。Table 1中作者总结了出这两个病理类型在肿瘤位置、组织分级等变量中有何差异

参考文献：Yu JI,et al. Differences in prognostic factors and patterns of failure between invasive micropapillary carcinoma and invasive ductal carcinoma of the breast: matched case-control study. Breast. 2010 Jun;19(3):231-7.

1-3. 变量名+总数+某变量分组+p值

1-1和1-2的综合。可以向读者展示更多细节。通常5列。

文章目的是两种病理类型的乳腺癌临床病理特点的比较。

参考文献：Hashmi AA, et al. Clinicopathologic features of invasive metaplastic and micropapillary breast carcinoma: comparison with invasive ductal carcinoma of breast. BMC Res Notes. 2018 Jul 31;11(1):531.

二

tableone包制作Table 1（2列）

以下数据来自SEER数据库的5000例乳腺癌病例，公众号回复：20210126获得

总结：过程其实就是输入3个条件【指定需要汇报的变量;指定这些变量中的分类变量；指定哪些连续变量是非正态分布】-----构建函数-----输出表格

安装R包、数据放入工作目录

#1.加载R包，电脑里若无tableone，去掉下面的#install.packages("tableone")library(tableone)#2.清理运行环境rm(list = ls()) #3.读入数据aa<- read.csv('20210126.csv')

查看数据构成

 #4.查看数据前6行 head(aa)

源数据尽量用英文单词或缩写而非0.1.2.3.4代替。因软件默认识别为连续变量，需要转换，很麻烦。用英文在整理表格时也方便，省时省力。

 #5.查看数据数据性质str(aa)

数据有5000病例；16变量，2连续变量（年龄和时间）；14分类变量及它们亚变量的个数和名字。

 #6.提取变量的名字 names(aa)

age=年龄，age70=以70岁为界分组的年龄，race=种族，marry=婚姻，t=t分期，n=n分期，tnm=tnm分期，er=雌激素受体，pr=孕激素受体，her2，g=组织分级，sur=手术，rt=放疗，che=化疗，status=死亡否，time=时间

连续变量正态性检验

 shapiro.test(aa$age)#p＞0.05才符合正态分布 shapiro.test(aa$time)#p＞0.05才符合正态分布

age和time SW检验p<0.05, 不符合正态性分布，Table1应汇报中位数+四分位数

前面的代码是只是查看数据性质，从第4步开始正式写Table 1代码。

输入Table 1的条件

#条件1# myVars的（）中输入想要在Table 1出现的变量【英文引号以英文逗号隔开】

 myVars <- c("age","age70"，"race", "marry",               "t", "n",  "tnm", "er", "pr",                "g","her2", "sur","rt","che",                "time","status")#16个变量

#条件2# catVars的（）内指明上述中哪些是分类变量

 catVars <- c("age70"，"race", "marry",               "t", "n",  "tnm", "er", "pr",               "g","her2", "sur","rt","che",                ,"status")#14个分类变量

#条件3# tableone包默认输出均数+标准差，所以nonvar的（）输入那些连续变量是非正态分布的（输出中位数+四分位数）

nonvar <- c("time","age")  # 指定哪些变量是非正态分布变量

构建Table 函数

 table<- CreateTableOne(vars = myVars,       #条件1                        factorVars = catVars, #条件2                        data = aa,  #源数据                        addOverall = TRUE)  #增加overall列

输出结果

  table1 <- print(table,  #构建的table函数（包括条件1.2）                  showAllLevels=TRUE, #显示所有变量                  nonnormal = nonvar) #条件3

age和time均汇报为中位数+四分位数，分类变量均汇报为数目加百分数

保存至Excel

 write.csv(table1, file = "table1.csv")

三

tableone包制作Table 1（4列）

4列的Table 1其实就是在构建table 1时加入了一个变量分列条件而已。

需要注意的是此时应先验证连续变量和分类是哪种检验方法。

详见：R语言|2. 连续变量相关性比较和R语言|3. 分类变量检验

前面操作1-4不变

library(tableone) #1.加载R包rm(list = ls()) #2.清理运行环境aa<- read.csv('20210126.csv') #3.读入数据head(aa)  #4.查看数据前6行str(aa)   #5.查看数据数据性质names(aa) #6.提取变量的名字

#条件1不变# myVars的（）中输入想要在Table 1出现的变量

 myVars <- c("age","age70"，"race","marry",               "t","n", "tnm","er","pr",               "g","her2", "sur","rt","che",               "time","status") #16变量

#条件2不变# catVars的（）内指明上述中哪些是分类变量

 catVars <- c("age70"，"race", "marry",               "t", "n",  "tnm", "er", "pr",               "g","her2", "sur","rt","che",                ,"status")

构建Table函数

#构建table 函数，加入条件4，strata = " " 。英文引号内填入需要分列的变量，例如本研究想探索放疗对预后的影响，则为strata = "rt"

table <- CreateTableOne(vars = myVars, #条件1                       factorVars = catVars,#条件2                       strata = "rt", #条件4                        data = aa, #原始数据                       );table

#条件3不变#. 指定非正态分布连续变量变量

 nonvar <- c("time","age")

#条件5新加入# 假如有T<5变量应使用Fisher精确检验，本文数量大，无需Fisher精确检验

 exactvars <- c("a", "b")

#附加细节条件#：

catDigits = 2, contDigits = 3, pDigits = 4,修改连续变量小数位数为2位,分类变量百分比位数为3位,调整小数位数为4位；

输出结果

把构建的table+条件1-5+附加细节条件放入print（）函数

table1<- print(table, #构建的table函数（带条件1.2.3）                 nonnormal = nonvar,#条件4                 #exact = exactvars,#条件5                 catDigits = 2,contDigits = 3,pDigits = 4, #附加条件
                 showAllLevels=TRUE, #显示所有变量                 quote = FALSE, # 不显示引号                 noSpaces = TRUE, # #删除用于对齐的空格                 printToggle = TRUE) #展示输出结果

保存为Excel

 write.csv(table1, file = "table1.csv")

四

tableone包制作Table 1（5列）

制作4列的所有条件不变（1-5+附加条件），在构建table函数时的代码增加一个addOverall = TRUE

构建Table函数

 table <- CreateTableOne(vars = myVars, #条件1                       factorVars = catVars,#条件2                      strata = "rt", #条件4                       data = aa, #原始数据                       addOverall = TRUE);table#条件6加入overall

输出Table 1（代码不变）

 table1<- print(table, #构建的table函数（带条件1.2.3）                  nonnormal = nonvar,#条件4                  #exact = exactvars,#条件5                  catDigits = 2,contDigits = 3,pDigits = 4, #附加条件
                  showAllLevels=TRUE, #显示所有变量                  quote = FALSE, # 不显示引号                  noSpaces = TRUE, # #删除用于对齐的空格                  printToggle = TRUE) #展示输出结果

函数CreateTableOne()所以细节条件汇总，即第5步。

构建Table函数

 table <- CreateTableOne(  vars, #指定哪些变量是Table 1需要汇总的变量  strata,#指定进行分类的变量，不写则只出Overall列  data,# 变量的数据集名称  factorVars,#指定哪些变量为分类变量，指定的变量应是vars参数中的变量  includeNA = FALSE,#为TRUE则将缺失值作为因子处理，仅对分类变量有效  test = TRUE,#默认为TRUE，当有2个或多个组时，自动进行组间比较  testApprox = chisq.test,#默认卡方检验  argsApprox = list(correct = TRUE),# 进行连续校正的chisq.test  testExact = fisher.test,#进行fisher精确检验  argsExact = list(workspace = 2 * 10^5),# 指定fisher.test分配的内存空间  testNormal = oneway.test, # 连续变量为正态分布进行的检验，默认为oneway.test，两组时相当于t检验  argsNormal = list(var.equal = TRUE), # 假设为等方差分析  testNonNormal = kruskal.test,# 默认为Kruskal-Wallis秩和检验  argsNonNormal = list(NULL),#传递给testNonNormal中指定的函数的参数的命名列表  smd = TRUE,#如果为TRUE（如默认值）并且有两个以上的组，则将计算所有成对比较的标准化均值差。  addOverall = FALSE#仅在分组时使用）将整个列添加到表中。Smd和p值计算仅使用分层的列阵进行。);table

#print（）函数细节汇总，即第6步

输出Table 1

table1<- print(  x, #CreateTableOne()的 <- 前的名字(x=table)  catDigits = 1, #连续变量小数位1位  contDigits = 2,#分类变量保留2位  pDigits = 3,#p值保留3位  quote = FALSE,#默认值为FALSE。如果为TRUE                #，则包括行名和列名在内的所有内容都用引号引起来，以便您可以轻松地将其复制到Excel。  missing = FALSE,#是否显示丢失的数据信息  explain = TRUE,#显示百分比时是否在变量名称中添加解释，即（％）添加到变量名称中。  printToggle = TRUE,#如果为FALSE，则不输出  test = TRUE,#是否显示p值。默认为TRUE。  smd = FALSE,#是否显示标准化均值差异。默认为FALSE。如果存在多个对比，则显示所有可能的标准化均值差的平均值。  noSpaces = FALSE,#是否删除为对齐而添加的空格。  padColnames = FALSE,#是否用空格填充列名以居中对齐。默认值为FALSE。如果noSpaces = TRUE，则不进行  varLabels = FALSE,#是否用从labelled :: var_label（）函数获得的变量标签替换变量名。  format = c("fp", "f", "p", "pf")[1],#默认值为“ fp”频率（百分比）。您也可以选择仅“ f”频率，“仅p”百分比和“ pf”百分比（频率）。  showAllLevels = FALSE,#是否显示所有级别。  cramVars = NULL,#字符向量，用于指定两个级别的分类变量，对于这两个级别的变量，应在一行中显示两个级别。  dropEqual = FALSE,#是否删除“ =第二级名称”描述，指示为两级分类变量显示哪个级别。  exact = NULL,#字符向量，用于指定p值应为精确测试值的变量。  nonnormal = NULL,#字符向量，用于指定p值应为非参数检验的变量的变量。  minMax = FALSE#对于非正态变量，是否使用[min，max]而不是[p25，p75]。默认值为FALSE。)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制的相关文章

objdump说明

objdump有点象那个快速查看之流的工具就是以一种可阅读的格式让你更多地了解二进制文件可能带有的附加信息使用objdump显示vxWorks的文件头信息以及入口地址例子 D ftproot gt C Tornado2 2Arm hos
如何将子窗口的值传到父窗口去调用

这是我当初的问题现在我想实现这样一个功能现在父窗口有一个select控件同时有一个增加按钮点击按钮弹出一个窗口这时弹出窗口也有一个table 同时有一个确认按钮 table中有若干项每一行对应一条记录并有一个chec
多表可更新视图的实现

多表关联后的数据能保证主键唯一的视图是可直接做更新不需要用触发器实现多表视图的定义当视图的数据源只有一张数据表则该视图为单表视图当视图的数据源是多张数据表则该视图为多表视图可更新视图的定义在绝大多数人的概念中视图是只读的
查询及删除重复记录的方法

一 1 查找表中多余的重复记录重复记录是根据单个字段 peopleId 来判断 select from people where peopleId in select peopleId from people group by peopl
SQL Server学习之复合索引

概要什么是单一索引什么又是复合索引呢何时新建复合索引复合索引又需要注意些什么呢本篇文章主要是对网上一些讨论的总结一概念单一索引是指索引列为一列的情况即新建索引的语句只实施在一列上用户可以在多个列上建立索引这种索引叫做复合索
浅谈exp与expdp的区别

1 把用户usera的对象导到用户userb 用法区别在于fromuser usera touser userb remap schema usera usera 例如 imp system passwd fromuser usera to
Oracle中connect by...start with...的使用

一语法大致写法 select from some table where 条件1 connect by 条件2 start with 条件3 其中 connect by 与 start with 语句摆放的先后顺序不影响查询的结果 wh
alter table move跟shrink space的区别

author skate time2010 05 28 alter table move跟shrink space的区别今天主要从两点说他们的区别 1 碎片的整理 2 空间的收缩 SQL gt select from v version
table中嵌套多层table

因工作业务需求需要展示一个多层嵌套的数据结构现整理如下分享给需要的朋友应用框架vue2 初始的数据结构如下 new Vue el table1 data table1 order ex 20171006 table2 kind 苹果
sqlite 利用bat批处理

最近忙着给手机平台完善日志和数据统计系统之前利用txt文件来处理大概用了2个月愈加发现数据统计和日志分析的难度所以从昨天开始计划找个小型的数据库系统 sqlite在我处理android和iphone客户端开发的时候就接触过但是没
jquery ui 实现table的sortable功能以及过滤记录功能

本人在工作中曾使用js实现过用鼠标拖动表格的行实现重新排序的功能当时写了不少的js代码最近发现jquery ui也能实现这个功能而且很方便真后悔当时不知道有这么个好东东好现在介绍下如何使用jquery ui来实现引入的js文件
普通视图和物化视图的区别

物化视图是一种特殊的物理表物化 Materialized 视图是相对普通视图而言的普通视图是虚拟表应用的局限性大任何对视图的查询 Oracle都实际上转换为视图SQL语句的查询这样对整体查询性能的提高并没有实质上的好处 1 物化
Create Ms Word doc using Javascript And vbscript .
漂亮的表格样式(使用CSS样式表控制表格样式)

依照WEB2 0风格设计了几个表格样式希望大家喜欢 WEB2 0提倡使用div开布局但不是要完全放弃使用表格表格在数据展现方面还是不错的选择现在使用介绍使用CSS样式表来控制美化表格的方法 lt html xmlns http
查询SQL表占用空间（sp_spaceused 表名)

create table tablespaceinfo 狦 nameinfo varchar 50 rowsinfo int reserved varchar 20 datainfo varchar 20 index size varcha
antd 中 Table表格合并行

1 首先获取所要合并行的column 去除每一行数据的rowkey 本例取的是Name这一列 2 当Name的值在多个页面出现时需重新记录rowSpan 3 合并column中具有相同Name的行结果图如下表格数据 const Data
UISearchBar 和 UISearchDisplayController的使用

之前比較少用UISearchBar 和 UISearchDisplayController 最近閱讀了一些有關資料簡單做個筆記 1 UISearchBar 和 UISearchDisplayController 在IB中是可以直接使用的
具有不同颜色单元格的JTable

最近在实现操作系统分页式存储管理演示程序时实现了设置JTable对象单元格不同颜色效果在网上也有这方面的一些提问和讨论但很多论坛内都没有很好的解释或完整的程序因此将这段程序贴出来供大家学习和指正在本例中每个单元格的颜色随机生成
CSS中设置表格TD宽度的问题

CSS布局表格宽度不听使唤的实例想把表格第一例宽度设为20 其他自适应但CSS中宽度是等宽的只设这一行也不起作用但是在实际应用中总是等宽处理并不按照样式来走 XML HTML代码
15款提高表格操作的jQuery插件

table表格由于它的浏览器兼容性和复杂的标签嵌套方式可以算是添加样式最困难的对象之一了大多数前端er都把网页中的table标签替换为div 主要就是因为div要比table更容易添加CSS样式但是我们在日常应用中仍然要用到table

随机推荐

【ROS】学习路线与方法-个人感悟篇

文章目录目录文章目录前言视频学习书籍学习个人建议前言前前后后 xff0c 对于ROS的学习已经很多遍了 xff0c 可以说走的弯路有点多 xff0c 导致浪费了很多时间 xff0c 其实ROS不应该是一个专门需要去学习的东西
【基于FreeRTOS的STM32F103系统】Heap_4内存管理机制程序详解

系列文章目录基于FreeRTOS的STM32F103系统简介及官方文件移植基于FreeRTOS的STM32F103系统编写FreeRTOS程序基于FreeRTOS的STM32F103系统内存管理及任务调度基于FreeRTOS的
【问题解决】虚拟机打开gazebo黑屏、闪退、模型加载不出来

1 缺少模型库可以在github上下载模型库 xff0c 但是速度极慢 xff0c 因为服务器在国外此处提供快速下载方法 xff0c 通过码云快速git clone cd gazebo git clone https gitee com
【ROS】package.xml文件解析

文章目录文章目录前言一基本格式 1 基本结构 2 必要标签 3 依赖关系二 Metapackage包总结前言 ros每个功能包中都有一个包清单 xff0c 它是一个名为package xml的XML 文件 xff0c 它必须包
【ROS】dynamic_reconfigure配置详细说明

文章目录文章目录前言一编写 cfg文件二为节点配置dynamic reconfigure 总结前言 dynamic reconfigure配置是ROS中为了方便用户对程序中的参数进行实时调整而推出的工具 xff0c 配置好自己
【ROS】使用pluginlib自定义costmap地图层

文章目录文章目录前言一重写地图层 1 包含头文件 2 onInitialize 3 updateBounds 4 updateCosts 二向ROS注册 1 插件描述文件 2 向ROS注册插件 3 在costmap配置文件中使用
【问题解决】Ubuntu20.04下move_base发送目标Bug

项目场景 xff1a 虚拟机 xff1a Linux的Ubuntu20 04 ROS版本 xff1a Noetic 场景 xff1a 使用虚拟机在gazebo中进行差速机器人仿真问题描述在自己编写多目标导航功能包时 xff0c 选择好目
ESP8266学习笔记一互联网通讯协议

互联网协议 TCP IP协议协议作用简单来说就是规范不同的语言 xff1b 包含的协议有 TCP IP实际上是一个协议组不同的协议处于不同的层次上 xff08 由下到上 xff09 链路层WIFI 网络层IP 传输层TCP UDP 应
谷粒学院项目笔记10——SpringCloud

尚硅谷谷粒学院项目第十天内容之SpringCloud 概念微服务 xff1a 是一种架构风格 xff0c 指将一个服务拆分成多个独立的服务模块 xff0c 从而解耦合 SpringCloud不是一个技术 xff0c 而是多种技术的总称 x
workman部署后，连接不上

1 去阿里云的安全规则增加2个端口 xff0c 这两个端口是workman里面配置的 2 去宝塔开放4435端口 xff1b 3 到api文件夹下执行 xff1a php think worker gateway start 4 后台常驻
RuntimeError: DataLoader worker (pid 4499) is killed by signal: Segmentation fault.检查内存条！

报错首先放上报错图 xff1a 根据报错内容 xff0c 上网查阅资料 xff0c Pytorch dataloader 错误 DataLoader worker pid xxx is killed by signal 解决方法按照教程
()、[]、{}、(())、[[]]等各种括号的使用

欢迎关注微信 xff1a 生信小博士 1 小括号圆括号 xff08 xff09 1 1 单小括号命令组括号中的命令将会新开一个子shell顺序执行 xff0c 所以括号中的变量不能够被脚本余下的部分使用括号中多个命令之间用分号隔开
FastQC原始安装

1 下载fastqc wget http www bioinformatics babraham ac uk projects fastqc fastqc v0 11 5 zip 2 解压 unzip fastqc v0 11 5 zip
r语言中六种方法查看R函数源代码—— 鼠标放在函数上，按下F2

欢迎关注微信 xff1a 生信小博士加油 1 最直接的方法当然是直接键入函数不加括号 xff0c 大部分函数源代码就可以直接显现出来我以PerformanceAnalytics包中的函数chart Correlation 为例 2 在
空间转录组学（Spatial Transcriptomics）

01 空间转录组技术的发展近年来单细胞转录组测序技术的应用大大拓宽了人们的视野 xff0c 使人们能够深入了解组织中细胞的构成的多样性和基因表达状态众所周知 xff0c 基因表达具有时间和空间的特异性 xff0c 通过对不同时间点的样本
修改R语言安装包的默认路径 r包安装位置

修改R语言安装包的默认路径 r包安装位置一次性 xff08 每次都需要设置 xff09 xff1a 运行命令 xff1a libPaths 查看已经安装的r包位置 libPaths 34 yourpath 34 设置新的r包位置或者 i
如何在ubuntu系统安装libboost-dev) and openmp libraries libboost-dev libomp-dev

https blog csdn net qq 41854911 article details 119454212 You need to have boost e g sudo apt get install libboost dev a
Docker删除容器命令

更多优质内容欢迎看看我的号 xff1a 生信小博士删除容器之前要先docker stop 容器 span class token number 1 span 删除指定容器 docker rm span class token opera
生存分析原理简明教程单因素生存分析 Kaplan-Meier、LogRank 只能针对单一的变量进行多因素cox回归分析

一生存分析狭义上来说 xff0c 生存分析用来分析病人的生存和死亡情况广义上讲的是事件是否发生在这里就用是否死亡来代替一般来说 xff0c 生存的数据一般有两个变量 xff0c 一个事件是否发生 xff0c 病人是否死亡 xff0
R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制

R语言 4 轻松绘制临床基线表Table 1 regular table regular 欢迎关注公众号第四次考核 Jimmy 学徒考核 Linux安装软件 rnaseq上游分析 2 ascp kingfisher数据下载ena qq c

R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制

R语言|4. 轻松绘制临床基线表Table 1 regular table regular

R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制 的相关文章

随机推荐

热门标签

R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制的相关文章