删除 R 中除撇号和字内破折号之外的标点符号

2024-03-21

我知道如何单独删除标点符号并保留撇号:

gsub( "[^[:alnum:]']", " ", db$text )  

或者如何使用 tm 包保留字内破折号:

removePunctuation(db$text, preserve_intra_word_dashes = TRUE)

但我找不到同时完成这两件事的方法。例如,如果我原来的句子是:

"Interested in energy/the environment/etc.? Congrats to our new e-board! Ben, Nathan, Jenny, and Adam, y'all are sure to lead the club in a great direction next year! #obama #swag"

我希望它是:

"Interested in energy the environment etc Congrats to our new e-board Ben Nathan Jenny and Adam y'all are sure to lead the club in a great direction next year obama swag"

当然,会有多余的空格,但我可以稍后删除它们。

我将感谢您的帮助。


Use 字符类 http://www.regular-expressions.info/charclass.html

gsub("[^[:alnum:]['-]", " ", db$text)

## "Interested in energy the environment etc Congrats to our new e-board Ben Nathan Jenny and Adam y'all are sure to lead the club in a great direction next year obama swag"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

删除 R 中除撇号和字内破折号之外的标点符号 的相关文章

  • 在 Linux 下更改 RStudio 用户界面(不是图形等)中的字体大小

    This is not关于更改使用 RStudio 生成的图表中的字体大小的问题 我已经知道该怎么做了 我在配备 视网膜 显示屏的 MacBook Pro 上的 Linux 下使用 RStudio 我使用 KDE 作为我的窗口管理器 我可以
  • 在 R Shiny 中显示/隐藏整个框元素

    我目前正在尝试找到一种方法来隐藏 显示 R Shiny 中的整个 box 元素 以及里面的所有内容 我想创建一个可能的按钮 它允许用户展开特定框 然后使用相同 甚至不同 的按钮隐藏它 我不想使用条件面板 因为我的应用程序非常大并且会产生一些
  • 如何制作一连串的ggplots并在它们之间绘制箭头?

    对于一个项目 我需要绘制一些图并在它们之间放置箭头作为序列的指示 我想知道我是否可以用 ggplot 来做到这一点 是否可以使用 ggplot2 绘制一个干净的大箭头并将其添加到最终的多重图中 作为示例 我使用此代码来绘制绘图 librar
  • 在 ggplot 中过滤管道 df

    我正在使用 dplyr 管道来清理我的 df 然后直接输入到 ggplot 中 但是 我只想一次只绘制一组 因此我需要过滤到该组 问题是 我希望比例保持不变 就好像所有群体都存在一样 是否可以在 ggplot 命令中进一步过滤管道 df 例
  • 使用插入符和方法 = gamLoess 进行训练时 R 崩溃

    当我运行下面的代码时 R 崩溃了 如果我在训练调用中注释掉tuneGrid行 就不会发生崩溃 我已经用另一个数据集尝试过此操作 但仍然使 R 崩溃 崩溃消息是 R 会话中止 R遇到致命错误 会话被终止 开始新会话 代码是 library s
  • R Shiny - 使用 DataTable 移动列名称

    我有一个非常复杂的闪亮代码 其中有几个面板和这些面板内的几个表格 启动应用程序时 列名称与列值正确对齐 但是 一旦我更改应用程序表格下的页码 列名称就会移动到左侧 而值仍保留在中间 如何强制应用程序使列名称与列值对齐 一个可重现的例子 li
  • 如何缩短 PHP if 语句?

    我有一个 if 语句 我需要将单个字符串与许多不同的选项进行比较 我在下面发布的代码非常清楚地表明了我的意思 我知道有两种方法可以做到这一点 但另一种甚至更长 那么 是否有任何函数可以以更短的方式实现类似的功能 我的要求可能看起来很愚蠢 但
  • R - 如何为数据范围内的缺失值绘制条形图零点?

    假设我对 1 到 10 之间的整数的 200 个点有 10 个观察值 mysample sample rep seq 1 10 20 10 我想用条形图绘制它 barplot table mysample barplot https i s
  • 为什么 JavaScript 中是 [1,2] + [3,4] = "1,23,4" ?

    我想将一个数组的元素添加到另一个数组中 所以我尝试了以下方法 1 2 3 4 它的回应是 1 23 4 到底是怎么回事 The 操作员没有为数组定义 发生的事情是 JavaScript将数组转换为字符串并将它们连接起来 Update 由于这
  • R -> kdb:将 R 数据作为二进制对象传递给 kdb+

    最有效的插入方式是什么R对象 更具体地说 时间序列表示为xts or data table对象 即基于时间和数字的列 到kdb 数据库 我能够通过以下方式找到唯一涉及字符串序列化的解决方案q所描述的表达式here https stackov
  • dplyr:同一公式中全年每日值的总和以及特定每日值的总和

    Using df数据框 date lt rep as Date seq as Date 2003 01 01 as Date 2005 12 31 by 1 format Y m d 9 site lt c rep Site 1 3 109
  • 正则表达式:如何从字符串中获取单词(C#)

    我的输入由用户发布的字符串组成 我想做的是创建一本包含单词以及它们的使用频率的字典 这意味着我想解析一个字符串 删除所有垃圾 并获取单词列表作为输出 例如 假设输入是 LOLOLOL YOU VE BEEN PWN3D 1einszwei
  • 将 R 与 Rsruby 集成

    我想知道是否有人有将 R 集成到 Rails 中的经验 特别是在 heroku 上 我熟悉 rsruby gem 它是 ruby 与 R 事实上的 也许是唯一的 绑定 但是有关将 R 与 Rails 集成的文档即使不是不存在 也是很少的 比
  • R List with sub-list:将与规则匹配的所有元素提取到数组中

    我有一个 R 对象列表 它们又是各种类型的列表 我想要类别为 内部 的所有对象的 成本 值 实现这一目标的好方法是什么 如果我有一个数据框我会做类似的事情 my dataframe cost my dataframe category in
  • 在 ggplot2 上绘制世界地图

    我一直在尝试在 ggplot2 上绘制世界地图 我跟踪了电子邮件的线索 带 l 的 ggplot 地图 https stackoverflow com questions 9558040 ggplot map with l但我确实遇到了同样
  • ggplot2:图例下方的中心图例而不是面板区域

    ggplot默认情况下 图例位于面板下方居中 这在某些情况下确实令人沮丧 请看下面的例子 ggplot diamonds aes cut fill clarity geom bar coord flip theme legend posit
  • 在 Rlattice xyplot 上分别控制轴刻度和轴线

    我怎样才能去除周围的盒子xyplot 同时保留轴刻度刻度线 本着爱德华 塔夫特 Edward Tufte 极简主义数据图形美学的精神 这些轴线是 非数据墨水 并且可以 应该 被 擦除 library lattice my df lt dat
  • tidyr:将一列分成可变数量的列

    我的数据框中有一个变量 其中包含回答问卷中不同问题的长度 数据结构如下 data lt data frame variables c q1 2 q2 3 q3 4 q4 10 q5 1 q2 3 q1 2 q3 2 q5 2 q4 9 q1
  • 如何判断一个字符串是否包含特定子串

    给定一个字符串A 如何确定该字符串是否包含子字符串 video x flv A indexOf video x flv gt 0
  • dplyr +“meta”-columns:当列包含要使用的其他列的名称而不是数据时

    我想知道以下问题在 dplyr 中是否有一个优雅的解决方案 要提供一个简单的可重现示例 请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA

随机推荐

  • “median”没有可见的全局函数定义

    自从最新的 R 更新以来 我得到了注释 Summary xmlImport 中位数 没有可见的全局函数定义 在 CRAN 检查中 更多注释请参阅read table write table以及 R 中的其他标准函数 当我查看文件summar
  • Rails 根目录路径?

    如何获取 Rails 应用程序的根目录路径 在 Rails 3 及更高版本中 Rails root 它返回一个Pathname http www ruby doc org stdlib 1 9 3 libdoc pathname rdoc
  • 多个实体到同一个 DbSet

    假设我有两个不同的课程 它们共享一些属性 但也有一些单独的属性 public class A Shared properties public int Id get set public DateTime CreatedDtm get se
  • llvm OCaml 绑定

    我正在研究 llvm OCaml 绑定 我通过 opam 安装了 llvm 包 opam install llvm 当我在 utop 中使用 llvm 时 出现以下错误 require llvm Error The external fun
  • 使用perl解码unicode转义字符

    我讨厌问一个无疑已经回答过十几次的问题 但我发现编码问题令人困惑 并且很难将其他人的问答与我自己的问题相匹配 我正在从在线 json 文件中提取信息 但我的 perl 脚本无法正确处理 unicode 转义字符 脚本如下所示 use LWP
  • 有没有办法在没有数据源的情况下创建 LINQ 查询作为变量?

    前言 我的核心问题与此非常相似 如何编写一个干净的存储库而不将 IQueryable 暴露给应用程序的其余部分 https stackoverflow com questions 1030992 how can i write a clea
  • 不插入成员的触发器不起作用

    我有这张桌子 CREATE TABLE members member id INT PRIMARY KEY NOT NULL first name VARCHAR 20 last name VARCHAR 20 web page VARCH
  • Vimeo 网站的缩略图比 YouTube 更难

    Merged https meta stackexchange com questions 158066 what is a merged question with 从 Vimeo 获取 img 缩略图 questions 1361149
  • 我可以将一个 .mdf 文件与多个 DBMS(SQL Server 2008 和 2012)一起使用吗?

    在家里 我安装了 SQL Server 2008 R2 Express 它附加到某个 mdf 文件 我正在安装 SQL Server 2012 开发人员版 我可以将 2012 附加到同一个 mdf 文件吗 从逻辑上讲 只要 SQL Serv
  • pandas / matplotlib:分面条形图

    我正在制作一系列包含两个分类变量和一个数字的数据条形图 我所拥有的是下面的内容 但我想做的是通过分类变量之一来进行刻面 就像facet wrap in ggplot 我有一个有点有效的示例 但是我得到了错误的绘图类型 线而不是条形图 并且我
  • 为什么 pub Upgrade 不升级软件包而只是显示它们

    我有 gt pub upgrade Resolving dependencies 6 2s analyzer 0 18 0 9 newer versions available angular 0 14 0 args 0 10 0 2 5
  • 聚合来自传感器的时间序列

    我有大约 500 个传感器 每个传感器大约每分钟发出一次值 可以假设传感器的值保持恒定 直到发出下一个值 从而创建时间序列 传感器在发送数据时并不同步 因此观察时间戳会有所不同 但所有数据都是集中收集并按传感器存储 以允许按传感器子集进行过
  • 将客户行为添加到 CDI 上下文中的所有 Spring Data Jpa 存储库

    我使用 CDI 成功注入 jpa 存储库 我想向所有存储库添加自定义行为 软删除 使用 spring 时 我可以通过指定存储库基类来启用客户行为 EnableJpaRepositories repositoryBaseClass Stage
  • WPF 灵活的 TabControl 标头

    我想要一个TabControl与多个TabItems These TabItems每个都有一个标题文本 这些文本的长度可能相差很大 例如 5 个字符长和 15 个字符长 我想要TabControl仅将标题对齐一行 所有选项卡标题应使用相同的
  • 如何通过Bootstrap垂直分隔线画线?

    我正在使用 Twitter Bootstrap 我需要绘制菜单线 https www dropbox com s hl8moeabxxecu8j dropdown png https www dropbox com s hl8moeabxx
  • 将 Create-React-App 与 Material UI 结合使用

    我是 Material UI 和 ReactJS 的新手 我一直在玩创建 React 应用程序 CRA https github com facebookincubator create react app and 反应带 https gi
  • 包括控制器中的模块

    我在 ruby on Rails 应用程序的 lib 目录中完成了一个模块 就像是 module Select def self included base base extend ClassMethods end module Class
  • ES6 中的延迟模块加载是如何工作的

    我怎么能够延迟加载ES6 模块 经过lazy 我的意思是我不想实际加载模块不需要 例如 我可以使用 RequireJS 执行以下操作 function someEventHandler var SomeModule require some
  • 使用Python的Azure定时器触发函数

    我正在使用 Python 3 x 编写 Azure 计时器触发器 我已经运行了一个这样的函数 我想我知道该怎么做 从 JS 创建一个 然后删除 index js 并创建一个 run py 但这一次 当我运行 python 函数时 总是收到错
  • 删除 R 中除撇号和字内破折号之外的标点符号

    我知道如何单独删除标点符号并保留撇号 gsub alnum db text 或者如何使用 tm 包保留字内破折号 removePunctuation db text preserve intra word dashes TRUE 但我找不到