捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置

2024-04-03

我是一名 Python 初学者，想要将现有的 xml 文件转换为 LaTeX 文档。 xml 包含许多脚注，有时会被拆分 - 因为它们不适合原始文档（一本旧书）中的一页，并且 xml 文件的创建者希望布局尽可能接近原始文档。在分割的脚注之间有普通文本以及其他脚注...... 下面的代码应该可以清楚地说明脚注之间的关系：


> normal text <note place="foot" n="(a)" xml:id="seg2pn_8_1"
> next="#seg2pn_8_2">aaa aaa aaa</note> normal text <note place="foot"
> n="(b)">footnote text</note>. normal text. <note place="foot" n="(a)"
> xml:id="seg2pn_8_2" prev="#seg2pn_8_1">bbb bbb bbb</note>

期望的输出是：

normal text \footnote{aaa aaa aaa bbb bbb bbb} normal text \footnote{footnote text}. normal text.

所有内容都可以位于注释的两个部分之间：普通文本、其他注释等。使用正则表达式的lookbehind和lookahead以及pythons zip方法我能够打印所需的结果：但我无法进行实际的替换并将结果写入第二个文件：

#!/usr/bin/env python3
import re
import sys
inFile = sys.argv[1]

with open(inFile,'r') as f:
   fin = f.read()

   strings_first = (re.findall('(?<=seg2pn_\d{1}_2">).*?(?=</note>)', fin, flags=re.DOTALL)) 
   strings_second = (re.findall('(?<=seg2pn_\d{1}_1">).*?(?=</note>)', fin, flags=re.DOTALL))

   for t, y in zip(strings_first, strings_second):
     print(t + y)

如果您对 XSLT 解决方案感兴趣，那么它非常简单。只需使用添加的规则进行身份转换：

<xsl:template match="note[@place='foot'][@next]">
  <xsl:copy>
    <xsl:value-of select="."/>
    <xsl:value-of select="id(substring(@next, 2))"/>
  </xsl:copy>
</xsl:template>

<xsl:template match="note[@place='foot'][@prev]"/>

这将脚注清理分为一个单独的处理阶段，这始终是保持此类应用程序逻辑简单的好主意。

我假设脚注永远不会分成两个以上的部分。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置的相关文章

字符串的“相关矩阵”。名义数据的相似度

这是我的数据框 df store 1 store 2 store 3 store 4 0 banana banana plum banana 1 orange tangerine pear orange 2 apple pear melon
通过pip安装lxml时出错：需要Microsoft Visual C++ 14.0

我使用的是 Windows 10 机器最近从 python 2 7 迁移到 3 5 当尝试通过 pip 安装 lxml 时它会停止并抛出此错误消息构建 lxml etree 扩展错误需要 Microsoft Visual C 14
PHP如何使用“ XML 中的实体与 DOMdocument

我正在修改由其他库生成的 XML 文件的内容我正在使用 PHP 5 3 10 进行一些 DOM 修改并重新插入替换节点我正在使用的 XML 数据有 quot 在进行操作之前的元素我想保留这些元素http www w3 org TR R
无法从同一项目的 bin 目录导入模块

我正在构建一个库该库将通过 pip 包含在其他项目中我有以下目录 venv 是 virtualenv project bin run py myproj init py logger py venv 我激活虚拟环境在 bin run
chrome_options.binary_location() TypeError: 'str' 对象不可调用

我希望每个人都好我是 python 新手我尝试运行这段代码但我不明白问题是什么以及如何解决这个问题我的代码是 from selenium import webdriver from time import sleep url raw
使用数据库数据模型生成 SQLAlchemy 模型、架构和 JSON 响应

将 Flask 和 SQLAlchemy 用于 Python Web 应用程序我的目标是创建一个系统在其中我可以从现有 PostgreSQL 数据库导入数据模型并将它们映射到相应 SQLAlchemy 模型中的字段使用这些 SQL
如何在Python中打印出字母表中的第n个字母？

ASCII 数学似乎在 Python 中不起作用一 5 不起作用如果没有字母数组如何快速打印出字母表中的第 n 个字母我天真的解决方案是这样的 letters A B C D E F G H I J K L M N O P Q R
登录 python + mod_wsgi 应用程序

我在 apache 服务器上部署了一个 python Flask 应用程序这是我的abc conf file WSGIDaemonProcess voting app threads 5 WSGIScriptAlias election
读取 JSON 文件并将其漂亮打印到另一个文件

我有一个复杂嵌套的 json 文本文件它是文本文件中的一长行有什么方法可以读取文件在 python 中并将 json 缩进漂亮地打印到新的文本文件中吗使用读取文件json load 并使用json dump 在指定缩进值时将
在 matplotlib 中查看然后自动关闭图形？

我必须检查我的参数设置是否正确因此我需要绘制许多图为了绘制这些图我选择使用 matplotlib 每次检查后我需要单击左上角的关闭按钮这很微不足道那么有没有什么方法可以让剧情在3 5秒左右显示并且无需点击就自动关闭呢我知道关于
向 list.extend() 传递不可迭代对象

我正在创建一个公共方法来允许调用者将值写入设备例如将其称为 write vals 由于这些值将实时输入因此我希望通过允许用户输入列表或单个值来简化用户的生活具体取决于他们需要写入的值的数量例如 write to device 1 2
如何确定输入的模式是“Int，VarChar，Date，Time ...”等

我有一个下拉菜单其中包含DataType 和一个文本框这是用于输入的Regex Pattern 如果我进入 test 在文本框中或从下拉菜单中选择Int 如果在文本框中输入则其模式是错误的 0 9 那么它的correct patte
当有效的 django 表单保存在数据库中时如何触发自定义 python 代码

Django 新手我创建了一个简单的表单如下this https www youtube com watch v 3XOS UpJirU教程我的表单正确地将数据保存在我的 Postgres 连接的本地数据库中我想知道每当将有效表单保
如何在这个可嵌套的 For 循环中实现 Robot Framework 风格的变量？

我在 Robot Framework 中见过很多嵌套 For 循环主要是创建一个内部带有 For 循环的关键字然后在另一个 For 循环中调用该关键字我使用 Python 2 7 13 制作了一个可嵌套的 For 循环但因为它主要
使用 Python 3.7+ 中的 wfastcgi 以及 Numpy、Pandas 等在 IIS 上部署 Python Flask 应用程序

使用 wfastcgi 在 IIS 上部署 python 3 7 Flask 或 Dash 应用程序时有许多很棒的教程可以让 hello work 程序正常运行例如 https medium com bilalbayasut deplo
从字符串中提取所有链接

我有一个 javascript 变量其中包含页面的 HTML 源代码不是当前页面的源代码我需要从该变量中提取所有链接关于什么是最好的方法的任何线索是否可以为变量中的 HTML 创建一个 DOM 然后遍历它我不知道这是否是推荐的方
如何按分层类别结构中的值对 pandas 中的数据框进行排序

我有一个 pandas 数据框 pd DataFrame category Transport Transport Car Transport Train Household Household Utilities Household Ut
Python 中的延迟求值/惰性求值

我想延迟对类实例的成员函数的调用的评估直到该实例实际存在最小工作示例 class TestClass def init self variable 0 self variable 0 variable 0 def get variabl
php 中是否可以使用正则表达式替换短语后面的单词？

输入文本工程学院医学院所需产出教育学院教育学院规则 school of 后面的任何单词都需要替换为 education inputext school of engineering school of medicine rule
mpld3图，注释问题

我正在使用 mpld3 在 Intranet 网站上显示图形我正在使用将图形保存到字典并使用 mpld3 js 在客户端渲染它的选项除非我想使用注释否则该图呈现良好这些显然是抵消的我不明白为什么因为即使我将偏移量设置为 0 0

随机推荐

如何将节点检查器与“npm start”一起用于我的应用程序？

我在用npm start启动我的 MEAN 堆栈应用程序但我想使用节点检查器来调试一些 Mongoose 我知道我可以启动节点检查器node inspector 但是我可以用什么来代替node debug app js与使npm sta
Delphi - 从静态链接的 MSVC++ 编译的 DLL 捕获 stdout 和 stderr 输出

我一直在努力捕捉stdout and stderr我的 Delphi 应用程序静态链接到的 MSVC 中编译的 DLL 的输出但到目前为止尚未成功 procedure Test var fs TFileStream begin fs TF
从另一个 git 存储库链接单个文件

你如何链接一个单个文件从另一个 git 存储库到您自己的存储库我不需要完整的存储库只需要一个文件使用git submodule看似正确的路线但它想要抓住整个事情考虑到 git 的工作单元是一个存储库或者更准确地说是一个存储库 c
禁用 JavaFX 图表背景图像的缓存

我有一个简单的折线图按下按钮即可在新窗口中打开该折线图使用存储在硬盘上的图像作为背景如果我关闭计算折线图的窗口更改图像文件或删除它并重新打开窗口则会再次加载旧图像我在场景生成器和代码中禁用了折线图的缓存但这没有帮助有人能
返回 false 不起作用

我创建了一种带有动态创建复选框的表单我使用了一个 j 查询脚本来检查天气用户是否选中了至少一个复选框如果没有那么它会发出错误消息警报 HTML 代码 print
android：应用程序不支持设备 - 为什么？

我目前正在开发一个相机应用程序现在一位用户抱怨他的设备不受支持它是宏碁A200 http www specsbox com 819 acer iconia a200 tablet html 我不明白为什么 android market
如何从Qt调用evaluateJavaScript()函数？

我无法从 QT 调用 javascript 函数我正在使用下面的代码 QT代码 QWebFrame frame m d gt m webView gt page gt mainFrame frame gt evaluateJavaScri
Acumatica 实时动态下拉列表

我有以下用例 Acumatica 组合框下拉列表可以有 8 个左右的值其选择决定了用于在组合框下拉列表中呈现的表 DAC e g 如果当前StatusProfileID WO1 和Status WCMP WCMP 是当前版本User
jQuery 选择器检查元素是否动画隐藏

有没有办法判断一个元素是否被隐藏或当前正在隐藏通过动画我能想到的唯一方法是将标志存储在元素的data你打电话时show or hide 但我想知道是否还有其他方法你能为它做一个自定义的 jQuery 选择器吗 function var
可达性 - 奇怪的问题

Reachability r Reachability reachabilityWithHostName www google com 这条线在设备上工作正常但在模拟器上我崩溃了由于未捕获的异常 NSInvalidArgumentExc
如何在 jQuery 中读取绑定的悬停回调函数

我使用 jQuery 为页面上的元素设置悬停回调我现在正在编写一个模块需要临时为某些元素设置新的悬停行为新模块无法访问悬停功能的原始代码我想在设置新的悬停功能之前存储旧的悬停功能以便在完成临时悬停行为后可以恢复它们我认为这些可以
从 bash 在默认编辑器中打开文件

如何使用 bash 打开使用默认 GUI 编辑器生成的脚本生成的文件在 OS X 上有命令open 但据我所知 linux 上不存在什么是好的跨平台替代方案执行open somefile ext在 OS X 上效果与我在 Finde
无法在 ASP.NET 中纠正 VeraCode CWE ID 918 - (SSRF)

长话短说无论我如何尝试 VeraCode 都会继续将我的 8 行代码标记为 CWE 918 缺陷这是旧代码所以我不确定为什么它突然被标记这是一个示例 offending 方法其中标记行以粗体显示 public virtual as
ItemTouchHelper startSwipe 不起作用

我尝试在适配器内使用 startSwipe 但似乎不起作用奇怪的是当我尝试用手指手动滑动它时它起作用了只是当我单击支架内的按钮时 startSwipe 不起作用需要这方面的帮助这是我调用 startSwipe 的地方在 onC
Intellij+Springboot+Thymeleaf+gradle - 自动重新加载html资源

我正在使用 IntelliJ Ultimate Spring Boot 和 Thymeleaf 我想启用 HTML 自动重新加载而无需重新启动服务器也无需使用 CTRL F9 我已经阅读了以下内容我认为它应该有效但事实并非如此 ht
自定义适配器不显示任何项目

这是先前问题的后续 ListView android 行中的 ImageButton 不工作 https stackoverflow com questions 29819256 imagebutton within row of list
Google 地图路线 API - 到达时间？

我使用 Google Directions API 来计算两个地点之间所需的时间 API 给了我一个选择departure time 我可以在其中传递出发时间或现在的时间戳那么答案就是duration in traffic 这真的很
使用 PyQT 逐帧加载 opencv 视频

我正在尝试加载一个 mat 文件具有被跟踪对象的位置坐标并加载一个视频文件为了加载视频文件我使用 opencv 我制作了一个 GUI 来加载它们一旦有人按下开始按钮视频就会开始播放暂停会停止播放这是它的 GUI 这是我遇到的
如何从 Perl 设置 Windows PATH 变量？

我需要在 Perl 中设置环境变量理想情况下我需要查询一个变量然后在不需要时更改它具体来说我要更改的是 PATH 变量我如何获取和设置这些变量如果您需要全局且永久地更改环境变量就像在控制面板中设置它一样那么您必须与注册表混
捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置

我是一名 Python 初学者想要将现有的 xml 文件转换为 LaTeX 文档 xml 包含许多脚注有时会被拆分因为它们不适合原始文档一本旧书中的一页并且 xml 文件的创建者希望布局尽可能接近原始文档在分割的脚注之间有普通

捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置

捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置 的相关文章

随机推荐

热门标签

捕获一个索引位置中的字符串并移动到 xml 文件中的另一个索引位置的相关文章