我需要使用正则表达式从 Python 文本文件中提取标题及其下方的文本块,但我发现这很困难。
我转换了这个PDF https://www.docdroid.net/rduS8oC/pdfsam-doc.pdf文本,现在看起来像这样:
到目前为止,我已经能够使用以下正则表达式获取所有数字标头(12.4.5.4、12.4.5.6、13、13.1、13.1.1、13.1.12):
import re
with open('data/single.txt', encoding='UTF-8') as file:
for line in file:
headings = re.findall(r'^\d+(?:\.\d+)*\.?', line)
print(headings)`
我只是不知道如何获取这些标题的措辞部分或它们下面的文本段落。
EDIT- 正文如下:
是。 EN 60601-1:2006&A1:2013&AC:2014&A12:2014
60601-1 © IEC:2005
60601-1 © IEC:2005
– 337 –
– 169 –
12.4.5.4 其他产生诊断或治疗辐射的 ME 设备
适用时,制造商应在风险管理过程中解决
与 ME 设备产生诊断或治疗辐射(除
用于诊断 X 射线和放射治疗(见 12.4.5.2 和 12.4.5.3)。
通过检查风险管理文件来检查是否符合要求。
12.4.6 诊断或治疗声压
适用时,制造商应在风险管理过程中解决
与诊断或治疗声压相关的风险。
通过检查风险管理文件来检查是否符合要求。
13 * 危险情况和故障情况
13.1 特定危险情况
13.1.1
当应用 4.7 中描述和 13.2 中列出的单一故障条件时,一次发生一个
时间内,不应出现 13.1.2 至 13.1.4(含)中的危险情况。
我的设备。
任何一个组件同时发生故障都可能导致危险情况
4.7 中描述。
13.1.2
不得发生以下危险情况:
– 危险气体中火焰、熔融金属、有毒或可燃物质的排放
数量;
——外壳的变形程度损害了 15.3.1 的规定;
–
当应用部件的温度超过表 24 中规定的允许值时
按11.1.3所述进行测量;
ME 设备部件的温度,这些部件不是应用部件,但可能是
经测量和调整后,超出表23允许值
11.1.3 中描述;
–
– 超出表 22 中确定的“其他部件和材料”的允许值
乘以 1.5 减去 12.5 °C。绕组的限值见表 26、表 27 和表 31。
在所有其他情况下,表 22 的允许值适用。
应使用 11.1.3 中描述的方法测量温度。
4.7、8.1 b)、8.7.2 和 13.2.2 中关于排放的单一故障条件
火焰、熔融金属或可燃物质不得应用于零部件
在哪里:
– 结构或供电电路限制了单故障时的功耗
条件小于 15 W 或能量耗散小于 900 J。