将全名向量拆分为 2 个独立向量的有效方法

2024-01-19

我有一个由全名组成的向量,名字和姓氏用逗号分隔,这就是前几个元素的样子:

> head(val.vec)
[1] "Aabye,ֲ Edgar"        "Aaltonen,ֲ Arvo"      "Aaltonen,ֲ Paavo"    
[4] "Aalvik Grimsb,ֲ Kari" "Aamodt,ֲ Kjetil Andr" "Aamodt,ֲ Ragnhild

我正在寻找一种方法将它们分成两个单独的名字和姓氏列。我的最终目的是将它们作为更大数据框架的一部分。

我尝试使用strsplit像这样的功能

names<-unlist(strsplit(val.vec,','))

但它给了我一个长向量而不是两个单独的集合,我知道它是 可以使用循环遍历所有元素,并将名字和姓氏放入 2 个单独的向量中,但考虑到大约有 25000 条记录,这有点耗时。

我看到了一些类似的问题,但讨论的是如何在 C+ 和 Java 上做到这一点


我们可以用read.csv来转换vector into a data.frame有 2 列

read.csv(text=val.vec, header=FALSE, stringsAsFactors=FALSE)

或者如果我们正在使用strsplit, 代替unlisting(这将转换整个list到一个单一的vector),我们可以提取出第一个和第二个元素list分别创建两个vectors(“v1”和“v2”)。

lst <- strsplit(val.vec,',')
v1 <- lapply(lst, `[`, 1)
v2 <- lapply(lst, `[`, 2)

另一种选择是sub

v1 <- sub(",.*", "", val.vec)
v2 <- sub("[^,]+,", "", val.vec)

data

val.vec <- c("Aabye,ֲ Edgar", "Aaltonen,ֲ Arvo", "Aaltonen,ֲ Paavo", 
        "Aalvik Grimsb,ֲ Kari", "Aamodt,ֲ Kjetil Andr", "Aamodt,ֲ Ragnhild")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将全名向量拆分为 2 个独立向量的有效方法 的相关文章

随机推荐

  • 单击时更改 li 元素上的背景

    我想要做的事情是 当用户单击链接时 背景应更改为 指示用户单击了哪个链接 我正在尝试用 jQuery 来做到这一点 menuLink click function var img this find img var id this attr
  • UITableViewCell高度问题

    我实际上正在尝试使图像视图高度动态化 我努力了UITableViewAutomaticDimension 在单元类中 我根据宽高比约束设置了图像的动态高度 好吧 你无法获得单元格的动态高度UITableView自动标注尺寸基于图像的约束 B
  • Jasper 报告在 netbeans 中工作正常,但在部署为 jar 应用程序时出现异常

    我正在使用 java swings 和 jasper reports 进行最后一年的项目 当我在 netbeans 中运行应用程序时 包括报告的应用程序工作正常 但当我将其部署到 jar 文件 然后尝试使用我的命令执行它时提示我看到这个巨大
  • 其他项目中的 Web Api 控制器,路由属性不起作用

    我有两个项目的解决方案 一个是 Web Api bootstap 项目 另一个是类库 类库包含一个具有属性路由的 ApiController 我将 Web api 项目的引用添加到类库中 并希望它能够正常工作 web api 中的路由配置
  • jQuery 将 $this 传递给函数参数

    I have img class bubbles src left png img class bubbles src right png 以及像这样的悬停事件 bubbles each function this hover functi
  • Concourse CI / Gradle:无法创建父目录

    我正在尝试使用 gradle 构建一个 java 项目3 4 1和使用 vagrant 的大厅concourse lite box v2 7 4 和 docker 镜像gradle 3 4 1 jdk8 My pipeline yml is
  • 在 Visual Studio 2010 中将多个项目的多个存储库合并到一个总体解决方案的存储库中?

    假设我有两个 Visual Studio 2010 项目 都在同一个解决方案中 其中一个项目是用于执行任务 x 的 dll 库 另一个是该库的 Windows 窗体 GUI 前端 我们还假设我开始使用两个不同的 Mercurial 存储库
  • Eclipse 的 ecj 编译器可扩展吗?

    我对修改 Java 语法和一些隐式范例感兴趣 由于我使用 Eclipse 进行开发 它提供了自己的编译器 也可以独立使用 所以我想知道是否无法扩展 ecj 以遵守其他语法规则 并正确处理它们 我的语法更改都可以通过从 AST 中删除元素并创
  • jvm 在负载下速度更快吗?

    大量的个人经验 轶事证据和一些基本分析表明 Java 服务器 通常运行 Oracle 的 1 6 JVM 在相当大的负载下 显然仅在一定程度上 具有更快的响应时间 我不认为这纯粹是热点 因为当流量减少时 响应时间会再次减慢 在许多情况下 我
  • 在 JavaScript 中序列化和反序列化数组

    我正在使用 jquery 的 tag it 库来制作一个标记系统 有点像 stackoverflow 的系统 用户输入标签后 库返回一个 JavaScript 数组 我想将其保存在 MySQL 数据库中 我在 javascript 中没有找
  • 内存泄漏和弱引用

    我遇到了一个问题 看起来像是我的一个应用程序中存在内存泄漏 该应用程序随着时间的推移使用更多的内存 在工作大约一周后它会挂起 我已经检测到并修复了一些与我编写的类相关的泄漏 比较使用 sos dll 进行的堆转储很快就发现了它们 并且这些泄
  • 如何关闭 VS Code 中的“匹配”突出显示?

    我不希望 Visual Studio Code 突出显示匹配的括号 所有出现的同一变量等 我发现它非常分散注意力 但是 我找不到禁用此功能的方法 我似乎能够更改的唯一突出显示选项是 editor selectionHighlight 和 e
  • Excel 宏冻结 Outlook

    我有一个相当重的 Excel 宏 当它运行时 Outlook 冻结 我知道它没有使用所有的 CPU 功率 因为a 我有一台强大的多核机器b 我的所有其他程序 甚至是重型程序 都运行良好 Outlook 和 Excel 似乎正在共享 Exce
  • 在下拉菜单中显示 SQL 数据库中的数据

    我有一个存储名称的数据库 我的数据库查询正在运行 但假设我有 5 个名称想要在下拉菜单中显示 如何使下拉菜单中的默认文本显示这 5 个名称 基本上我想要完成的是 查询我的数据库并将所有客户名称存储到一个变量中 假设数据库中有 5 个名字 我
  • 自动安装 IIS 7 及更高版本的 Powershell 脚本

    我是 powershell 的新手 我需要的是一个 powershell 脚本 可以自动安装 IIS7 或更高版本的过程 我需要对角色服务进行某些配置 任何在这方面的帮助都是值得赞赏的 我发现以下博客很有用 通过使用帮助进行了某些更改 我能
  • C++ for 循环优化问题

    我在 VC 中有以下代码 for int i a 1 b i lt a b i lt someObject gt someFunction i 据我所知 编译器优化了所有这些算术运算 并且它们不会在每个循环上执行 但我不确定它们是否可以告诉
  • 如何在多用户环境中处理表单编辑?

    我的应用程序是带有服务器和客户端的多用户应用程序 在这种形式中 多个用户可以同时访问 他们可以执行保存为草稿或提交操作 问题是我想控制多用户同时编辑表单 例如 用户 X 正在编辑文本字段 复选框的值并执行另存为草稿 同时用户 Y 编辑相同的
  • 自动创建用于 xml 反序列化的 C# 类不起作用

    我正在努力为此 xml 创建反序列化类
  • Elastic Search Kibana PDF 报告

    我正在尝试生成 PDF 报告并使用脚本下载它们 我按照以下说明进行操作 https github com elastic kibana blob master docs user reporting automating report Ge
  • 将全名向量拆分为 2 个独立向量的有效方法

    我有一个由全名组成的向量 名字和姓氏用逗号分隔 这就是前几个元素的样子 gt head val vec 1 Aabye Edgar Aaltonen Arvo Aaltonen Paavo 4 Aalvik Grimsb Kari Aamo