如何搜索多个字符串并将其替换为字符串列表中的任何内容

2024-04-29

我在数据框中有一列,如下所示:

npt2$name
#  [1] "Andreas Groll, M.D."
#  [2] ""
#  [3] "Pan-Chyr Yang, PHD"
#  [4] "Suh-Fang Jeng, Sc.D"
#  [5] "Mostafa K Mohamed Fontanet Arnaud"
#  [6] "Thomas Jozefiak, M.D."
#  [7] "Medical Monitor"
#  [8] "Qi Zhu, MD"
#  [9] "Holly Posner"
# [10] "Peter S Sebel, MB BS, PhD Chantal Kerssens, PhD"
# [11] "Lance A Mynderse, M.D."
# [12] "Lawrence Currie, MD"

I tried gsub但没有运气。 做完之后toupper(x)我需要替换“MD”或“M.D.”的所有实例或什么都没有的“PHD”。

有没有一个不错的简短技巧可以做到这一点?

事实上,我有兴趣看到它在单个字符串上完成,以及它在整个列表上的一个命令中完成的有何不同。


其中任何一个:

gsub("MD|M\\.D\\.|PHD", "", test)  # target specific strings
gsub("\\,.+$", "", test)        # target all characters after comma

上面的马特·帕克和下面的汤米都提出了“M.R.C.P.”、“PhD”、“D.Phil.”是否是“M.R.C.P.”的问题。和“博士学位”或其他英国或欧洲大陆的博士学位级别名称应被找出并删除。也许@user56 可以告知其意图是什么。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何搜索多个字符串并将其替换为字符串列表中的任何内容 的相关文章

随机推荐