将 HTML 转换为 R Markdown

2023-12-08

有没有办法转换html文件,例如https://cran.r-project.org/web/packages/tidytext/vignettes/tidytext.html,并将其转换为可执行的 R Markdown 文件(rmd)?


这是我使用的解决方案:

  • 将 .html 转换为 .md :
pandoc ./test.html -o test.md
  • 将 .md 重命名为 .rmd
mv test.md test.rmd
  • 对代码进行后处理以组织块和段落
# chunks r marker: replace ' {\.sourceCode \.r}' by '{r}'
sed -i 's/ {\.sourceCode \.r/{r/' test.rmd
# delete lines beginning wit ':::'
sed -i '/^:::/d' test.rmd
# delete lines beginning '![](data:image' (html plot)
sed -i '/^\!\[\](data:image/d' test.rmd
# delete paragraph separator lines
sed -i '/^=====/d' test.rmd
sed -i '/^-----/d' test.rmd
# replace paragraph marks
#'[1]{.header-section-number}' by '#'
sed -i 's/\[[0-9]\+\]{\.header-section-number}/#/' test.rmd
#'[1.1]{.header-section-number}' by '##'
sed -i 's/\[[0-9]\+\.[0-9]\+\]{\.header-section-number}/##/' test.rmd
#'[1.1.1]{.header-section-number}' by '###'
sed -i 's/\[[0-9]\+\.[0-9]\+\\.[0-9]\+]{\.header-section-number}/###/' test.rmd
  • 添加 YAML 标头
echo "$(echo -e "\n" | cat - test.rmd)" > test.rmd
echo "$(echo '---' | cat - test.rmd)" > test.rmd
echo "$(echo 'title: '\"'test'\" | cat - test.rmd)" > test.rmd
echo "$(echo '---' | cat - test.rmd)" > test.rmd

当然,您可以将这些行放在 .sh 中以简化任务

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 HTML 转换为 R Markdown 的相关文章

  • 零膨胀泊松分布的经验和理论分布图

    以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
  • 为什么 ggplot2 图例不结合手动填充和缩放值?

    预期行为 如果我用 ggplot2 创建一个绘图并使用单独的形状和填充比例来描绘数据 我希望图例会在 白色 填充点 看起来是空心的 和 黑色 填充点 看起来不空洞的 在下面的示例代码中 Windows 的图例项应为白色空心点 Linux 的
  • 保存/加载 data.table 的最快方法

    我想做的实际上是使用最快的可用方法来存储data table以便进一步处理 大致如下 从 CSV RDS 读取原始数据 将其转换为data table 将其保存为针对重新读取而优化的格式 RDS 似乎不适用于data table 是对的吗
  • 循环遍历列并将字符串长度添加为新列

    我有一个包含多列的数据框 并且希望为每个列输出一个单独的列 其中包含每行的长度 我试图迭代列名称 并为每列输出一个附加有 length 的相应列 例如 col1 col2 将转到 col1 列2 col1 长度 列2 长度 我正在使用的代码
  • 将值添加到 R 中 for 循环内的向量

    我刚刚开始学习 R 我编写了这段代码来学习函数和循环 squared lt function x m lt c for i in 1 x y lt i i c m y return m squared 5 NULL 为什么这个返回NULL
  • lme4:如何指定 2 个与随机截距的相关性,而不添加随机斜率之间的相关性

    重新发布自stats stackexchange com https stats stackexchange com q 195385 33560 我试图在 R 的 lme4 包中指定一个模型 其中随机截距和随机斜率之间有 2 个相关性 但
  • 将线条剪裁到绘图区域并在绘图区域外显示文本

    我想限制绘图的可见 y 范围 为了保留超出此范围的值 我需要设置oob 出界 to rescale none这效果很好 不过 我还想在图外的页边空白处添加一些文本 为了做到这一点 我需要关闭剪辑 这会导致超出范围的值被绘制在绘图区域之外的边
  • 在 R/ggplot2 中将字符串转换为函数参数的最佳方法? [复制]

    这个问题在这里已经有答案了 我正在开发一个闪亮的应用程序 用户可以选择可以使用 ggplot2 绘制哪些变量 但是我完全不确定将字符串 即要绘制的变量的名称 转换为合适的函数参数的最佳方法 考虑以下非常人为的 有效的示例 df lt dat
  • 在 R 中将本地日期时间转换为 UTC

    如何将本地日期时间转换为以下格式 12 31 2014 6 42 52 PM R 中的 UTC 我试过这个 as POSIXct as Date 12 31 2014 6 42 52 PM format m d Y H M S tz UTC
  • R 在 Ubuntu 中通过代理连接

    我在 Ubuntu 12 04 上安装了 RStudio 0 97 168 当我尝试安装 gstat 库时出现以下错误 install packages gstat dependencies TRUE Warning in install
  • 为闪亮的应用程序创建桌面图标

    当我在基本 R 提示中提供以下代码时 我会在浏览器中打开一个闪亮的应用程序 shiny runApp C Myapp 我使用 Windows 7 我试图创建一个桌面图标 以避免我的客户每次想要使用该应用程序时都键入上述代码 我创建了一个桌面
  • R 中的 For 循环分配给数据框

    运行 for 循环后 我在分配给数据帧时遇到问题 当我使用 print 时 它给出了我的价值 有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
  • 根据感兴趣的特定单词绘制高度相关的单词[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在尝试绘制一个单词的最高相关性 例如 我想绘制 鲸鱼 一词的最高十个相关性的图表 有人可以帮我执行类似的命令吗 如果有帮助的话我已经安装
  • 当 header=TRUE 时 read.fwf 出错

    我的模拟数据如下所示 LastName Date email CreditCardNum AgeZip Amount Paul 21 02 14 email protected cdn cgi l email protection 4241
  • 如何在 R 中使用 msgbox [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 如何在中显示消息框R 我正在寻找类似的东西msgbox在 VBA 中 因此我可以向用户发出有关问题的警报 此外 我想允许一些用户交互 例如
  • 将一个大的 xlsx 文件导入到 R 中?

    我想知道是否有人知道从 大 xlsx 文件 20Mb 导入数据的方法 我尝试使用 xlsx 和 XLConnect 库 不幸的是 两者都使用 rJava 我总是收到相同的错误 gt library XLConnect gt wb lt lo
  • 在 R 中高效加载稀疏矩阵

    我在将数据有效加载到 R 中的稀疏矩阵格式时遇到问题 这是我当前策略的 不完整 示例 library Matrix a1 Matrix 0 5000 100000 sparse T for i in 1 5000 a1 i idxOfCol
  • 在ggplot2中添加水平线到绘图和图例

    这段代码创建了一个漂亮的图 但我想在 y 50 处添加一条水平黑线 并让图例显示一条黑线 并在图例中显示文本 cutoff 但在图例中保留源点 我可以使用 geom line 添加该行 但无法在图例中获取该行 library ggplot2
  • R 中的微秒时间戳

    在 CSV 文件中 我有几列 其中一列有时间戳 其中每个时间戳是今天午夜经过的微秒 每个 csv 文件仅包含一天内的数据 因此这并不含糊 我的问题是 如何将这些微秒时间戳解析为 R 多谢 我的 CSV 文件的一部分 34201881666
  • 使用 ggplot2 在一张画布上绘制多个图形[重复]

    这个问题在这里已经有答案了 我正在尝试根据此表将两个 ggplot2 图合并为一个图 Type RatingA RatingB 1 One 3 36 2 Two 5 53 3 One 5 57 4 One 7 74 5 Three 4 38

随机推荐

  • 在 Flutter 中访问 Firebase 存储

    我对 Flutter 相当陌生 以前从未使用过 Firebase 所以如果有明显的解决方案 我深表歉意 我正在开发一个 Flutter 应用程序 其中涉及记录表单提交并将其提交到中央位置 Firebase Storage 似乎很合适 因为据
  • 获取 GeoPandas 中几何图形之间的交集计数

    是否可以使用 GeoPandas 对象获取两个几何图形之间的交集计数 也就是说 我想计算一个 GeoDataFrame 中与另一个 GeoDataFrame 中的每个多边形相交的多边形或线串的数量 在浏览 GeoPandas 文档时 我没有
  • 寻找 C# 注册表类 [已关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 寻找包装调用以执行以下操作的 C 类 读取和写入键值 读取和写入密钥条目 枚举键中的条目 这个很重要 例如 需要列出以下位置的所有条目 HKEY L
  • 如何使用装饰器将变量注入作用域?

    免责声明 可能有更多的Python方式来做我想做的事情 但我想知道Python的作用域在这里是如何工作的 我正在尝试找到一种方法来制作一个装饰器 该装饰器可以执行诸如将名称注入另一个函数的作用域之类的操作 这样该名称就不会泄漏到装饰器的作用
  • 根据参考重新排序多索引数据框列

    我有一个多索引数据框 其名称附加到列级别 数据表看起来像这样 df1 TIME TMC 111N1 111P2 111N3 111P4 DATE EPOCH 0 143 113 103 NaN 1 183 NaN NaN NaN 2 NaN
  • CodeIgniter 与 PHPExcel 致命错误无法重新声明类 IOFactory

    我正在尝试将 PHPExcel 与 CodeIgniter 一起使用 我的问题是当我想使用下面的方法时 我得到了PHP 致命错误 无法重新声明类 IOFactory 如果您不确定文件类型 则可以在使用 createReader 方法实例化读
  • 在切片末尾工作是否惯用?

    我正在阅读 Go 的compress flate包 我发现了这段奇怪的代码 1 n int32 len list list list 0 n 1 list n maxNode 在上下文中 list保证指向后面有更多数据的数组 这是一个私有函
  • 如何在 Laravel PHP 框架中合并两个集合而不丢失(丢失)键?

    我是 Laravel PHP 的新手 我正在做我的个人 玩具项目 我遇到了一个我已经在 Google 上搜索了很长时间的问题 但是 我无法找出完美的解决方案 问题是 我有两个集合 questions and answers 我想将它们合并到
  • 用欧拉化求解中文Postman算法

    我想在不存在欧拉循环的图中解决中国邮递员问题 所以基本上我正在寻找图中的一条路径 该路径恰好访问每个边一次 并在同一节点处开始和结束 当且仅当每个节点具有相同数量的进入和离开图的边时 图才会有欧拉循环 显然我的图表没有 我发现欧拉化 制作欧
  • System.Text.Json 中可以进行多态反序列化吗?

    我尝试从 Newtonsoft Json 迁移到 System Text Json 我想反序列化抽象类 Newtonsoft Json 为此提供了 TypeNameHandling 有没有办法通过 net core 3 0 上的 Syste
  • 如何在不使用浏览器的情况下从 .NET Web 服务代码从 OKTA 获取 SAML 令牌?

    我们拥有由 Kendo UI 和后端 NET Web 服务构建的混合移动应用程序 所有来自 UI 的调用都是通过 ajax 进行的 现在我们需要将应用程序集成到 OKTA 中以进行用户身份验证 但不确定如何直接从 Web 服务调用中从 OK
  • 在 ggplot2 中使用 Unicode 字符(加减号)

    我正在尝试构建一个包含 unicode 字符的图 正负号sign U 00B1 以下是一些虚假数据 library tidyverse set seed 1 df lt crossing Rated Movement c Running J
  • 在Java中将列表转换为数组[重复]

    这个问题在这里已经有答案了 我怎样才能转换List to an Array在Java中 检查下面的代码 ArrayList
  • 在启用 ASP.NET 兼容性/会话的环境中,AJAX 可访问的长时间运行的服务任务会阻止后续 AJAX 服务请求

    我遇到了以下链接中描述和解决的问题 http blogs msdn com b silverlightws archive 2009 09 30 having a pollingduplex service and any other wc
  • 不太清楚 Cassandra 的反模式

    假设有一个表 其结构如下 create table cities root text name text primary key root name with clustering order by name asc for getting
  • 如何检查图像的尺寸,以便按比例缩小图像以避免失真?

    当人们写文章时 他们会提交一张照片来说明事件 但是 展示的空间并不宽阔 所以 我想减少它们的宽度和 或高度 同时保持它们的原始比例 否则 图像会失真 假设最大宽度为 300px 任何比这更宽的宽度都会减少到 300 像素 但是 我希望高度减
  • 从 Nest Cam 访问直播

    我是一款名为 Feather featherapp co 的 Nest 综合 Apple TV 应用程序的开发人员 我遇到的一个问题是 用户希望能够查看摄像头的实时直播 有谁确定了访问摄像机实时画面的方法吗 我已经做了相当多的逆向工程 但我
  • 如何在spark scala中重命名S3文件而不是HDFS

    我在 S3 中存储了大约 100 万个文本文件 我想根据文件夹名称重命名所有文件 我怎样才能在 Spark scala 中做到这一点 我正在寻找一些示例代码 我正在使用 zeppelin 来运行我的 Spark 脚本 下面的代码我已经按照答
  • 使用 R 将图形导出到 .eps 文件

    如何将图表导出为 eps 格式文件 我通常将图表导出到 pdf 文件 使用 pdf 功能 效果非常好 但是 现在我必须导出到 eps 文件 我发现创建后记的最简单方法如下 使用setEPS 命令 setEPS postscript what
  • 将 HTML 转换为 R Markdown

    有没有办法转换html文件 例如https cran r project org web packages tidytext vignettes tidytext html 并将其转换为可执行的 R Markdown 文件 rmd 这是我使