如何从文本中删除所有 a href 标签

2023-11-25

我有一个脚本来替换“href”标签中的单词。不过,我想完全删除 a href,这样您就可以看到没有链接的 Google 一词。

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
    a['href'] = a['href'].replace("google", "mysite")
result = str(soup)

您还可以找到放在 href 中的所有单词,并在它们之前和之后放置一个“”。我不知道该怎么做。我想这是在更换之前完成的。


Use del a['href']相反,就像在普通字典上一样:

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
    del a['href']

给你:

>>> print str(soup)
<p>Hello <a>Google</a></p>

UPDATE:

如果你想摆脱<a>标签全部,你可以使用.replaceWithChildren() method:

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
    a.replaceWithChildren()

给你:

>>> print str(soup)
<p>Hello Google</p>

...以及您在评论中要求的内容(将标签的文本内容用空格包裹起来),可以通过以下方式实现:

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
    del a['href']
    a.setString(' %s ' % a.text)

给你:

>>> print str(soup)
<p>Hello <a> Google </a></p>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从文本中删除所有 a href 标签 的相关文章

  • 如何消除页面边缘的间隙?

    我已经将主体和两个 div 的边框 内边距和边距设置为 0px 但我似乎仍然无法摆脱差距 body padding 0px border 0px margin 0px width 100 height 100vh mainPage heig
  • 使用 Python 自动化旧的 DOS 应用程序

    有没有办法从Python 在Windows上 自动化旧的DOS应用程序 16位 可能需要模拟器 例如DOSBox 我想将密钥和字符串发送到应用程序 检测 DOS 屏幕 的更新并获取应用程序输出 如果 DOS 应用程序能够 隐藏 运行 即不显
  • 将 python 字典翻译为 C++

    我有包含以下代码的 python 代码 d d 0 0 0 d 1 2 1 d 2 1 2 d 2 3 3 d 3 2 4 for i j in d print d i j d j i 不幸的是 对于我的目的来说 循环遍历 python 中
  • 从右到左打印表格单元格

    我制作了一个表格 并希望第一个单元格从右侧开始 而不是默认从左侧开始 我尝试更改 CSS 中的 float 属性 但似乎没有帮助 这是代码 table border 0 width 100 cellspacing 0 align cente
  • 使用 Python 从基于 AJAX 的网站提取信息

    我正在尝试使用 Python 检索基于 ajax 的网站 例如 www snapbird org 上的查询结果 由于它没有显示在页面源中 我不确定如何继续 我是一个Python新手 因此如果我能得到一个指向正确方向的指针那就太好了 如果更容
  • Scala 组合器解析器 - 区分数字字符串和变量字符串

    我正在做 Cay Horstmann 的组合器解析器练习 我想知道区分代表数字的字符串和代表匹配语句中变量的字符串的最佳方法 def factor Parser ExprTree wholeNumber expr ident case a
  • 将字符转换为日期时间 odoo 9

    我有两个字符字段 从 odoo 中的 excel 或 csv 导入数据 time 1 fields Char string Time 1 time 2 fields Char string Time 2 result fields Floa
  • 如何删除Python中特定字符之前的所有字符?

    我想删除指定字符或字符集之前的所有字符 例如 intro lt gt I m Tom 现在我想删除 lt gt before I m 或者更具体地说 I 有什么建议么 Use re sub 只需匹配所有字符即可I然后将匹配的字符替换为I r
  • ValueError:当数组不是序列时设置带有序列的数组元素

    您好 此代码旨在存储使用 open cv 绘制的矩形的坐标 并将结果编译为单个图像 import numpy as np import cv2 im cv2 imread 1 jpg im3 im copy gray cv2 cvtColo
  • 在 Pandas 中,.iloc 方法是否提供副本或视图?

    我发现结果有点随机 有时它是副本 有时它是视图 例如 df pd DataFrame name Marry age 21 name John age 24 index student1 student2 df age name studen
  • 覆盖 Autobahn/Twisted WebsocketClientProtocol 类

    我想重写我的 WebSocketClientFactory 类以允许传入数据填充作业队列 这是我正在尝试的连接代码 factory WebSocketClientFactory ws localhost 7096 job queue Que
  • 带约束的简单线性回归

    我开发了一种算法来循环 15 个变量并为每个变量生成一个简单的 OLS 然后算法再循环 11 次以产生相同的 15 个 OLS 回归 但 X 变量的滞后每次增加 1 我选择具有最高 r 2 的自变量 并使用 3 4 或 5 个变量的最佳滞后
  • 联合超过 2 个 pandas 数据框

    我正在尝试将 sql 查询转换为 python sql语句如下 select from table 1 union select from table 2 union select from table 3 union select fro
  • 使用 str 方法替换 string 中的多个元素

    我正在尝试编写一个函数 它接受一串 DNA 并返回赞美 我已经尝试解决这个问题有一段时间了 并浏览了 Python 文档 但无法解决 我已经为该函数编写了文档字符串 以便您可以看到答案应该是什么样子 我在这个论坛上看到过类似的问题 但我无法
  • Python带有负数的排序列表[重复]

    这个问题在这里已经有答案了 为了尝试通过练习来学习Python 我正在尝试使用Python来实现和测试快速排序算法 实现本身并不困难 但是排序的结果有点令人费解 当我对列表进行排序时 35 1 2 7 8 3 4 20 6 53 结果给了我
  • 如何检查给定名称的变量是否是非本地变量?

    给定一个堆栈帧和一个变量名 我如何判断该变量是否是非局部的 例子 import inspect def is nonlocal frame varname How do I implement this return varname not
  • 检查单元测试中是否调用了 Timer.cancel

    我正在使用threading Timer包在 x 秒后执行方法 但是 在某些情况下 我想提前执行此方法并取消计时器 因此不会调用两次 我如何对此进行单元测试 我想知道计时器是否已停止 以便不再调用该方法 我现在使用以下代码 不幸的是is a
  • 如何从本地计算机或网络资源在 Jupyter Notebook 中嵌入图像或图片?

    我想将图像包含在 jupyter 笔记本中 如果我执行以下操作 它会起作用 from IPython display import Image Image img picture png 但我想将图像包含在 markdown 单元格中 并且
  • 导入 matplotlib.pyplot 挂起

    我正在尝试在 OS X 10 8 4 上启动并运行 matplotlib 我已经安装了 matplotlib 和依赖项 libping freetype numpy scipy 我可以很好地导入 matplotlib 但是 如果我尝试导入
  • 使用 pytz 获取时区的国家/地区代码?

    我在用着pytz http pytz sourceforge net country information 我已经阅读了整个文档表 但没有看到如何做到这一点 我有一个时区 美国 芝加哥 我想要的只是获取该时区的相应国家 地区代码 美国 它

随机推荐

  • 如何在 swift 中将字典分配给 AnyObject

    我一直在玩 Swift 我在类型方面遇到了多个错误 尤其是在使用 Swift 和我的旧 Objective C 类时 这个方法的问题是 我期待一个由 Objective C 中的 NSDictionarys 组成的数组 var curArr
  • Android 应用程序在本地或在线存储大数据?

    第一次发帖 第一次在 Android 上工作 所以如果我违反了任何规则 请放轻松 不管怎样 我刚刚开始制作一个 Android 应用程序 我正在尝试创建一个简单的问答游戏 我计划提出很多问题 希望大约 5000 多个问题 没有进行任何数据操
  • STL C++ 中的尾后迭代器是什么?

    任何人都可以解释我的意思是什么past the end 为什么我们打电话end 函数结束后 功能begin and end 定义一个半开范围 begin end 意思是 该范围包括第一个元素但不包括最后一个元素 因此 这个名字就结束了 半开
  • 为什么 Array 不重写 Ruby 中的三等号方法?

    我刚刚注意到数组不会覆盖三重等号方法 有时称为大小写相等法 x 2 case x when 1 2 3 then match else no match end gt no match 而范围运算符的作用是 x 2 case x when
  • 芹菜中的 Django 信号

    我有一个在 Celerybeat 实例中运行的任务 当执行该任务时 它有时会修改模型对象 这应该会触发 post pre save 信号 但事实并非如此 信号没有发生 我想这是因为 Django 的信号是同步的 而 celery 正在不同宇
  • Java 接口有什么真正的意义吗? [复制]

    这个问题在这里已经有答案了 可能的重复 Java接口实际上是如何使用的 我不是从学术流行语的角度来谈论 而是从实际开发人员的角度来谈论 举个例子 Class1 implements Interface public String metho
  • Twilio 调用在 iOS 和 Android 中的 React-Native 中不起作用

    i am trying to use twilio client in react native app here is the link Twilio repo after done all setup with react native
  • PHP 无法从 NFS 共享读取会话

    我将 PHP 会话文件存储在 NFS 共享上 问题是 PHP 总是创建一个空会话文件 但无法从中读取 写入 因此对于每个页面重新加载都会创建一个新文件 如果我将会话存储路径移动到本地文件夹 会话将正常保存 另外 我正在运行具有相同配置的另一
  • JAXB 2.1 - 自定义 xs:any 绑定

    我想使用 JAXB 2 1 XJC 从 xsd 生成 java 代码 我提供了 xsd 架构 但无法更改它 我想用xjc 简单模式 同时从 xml 模式生成 java 类 在xsd中有元素
  • 将 GTK3+ 与 py2exe 捆绑在一起

    平台是 Windows 7 64位 使用 python 2 7 和 GTK3 安装http sourceforge net projects pygobjectwin32 files source navbar exe已编译但无法运行 原因
  • 为什么 PHP 中不推荐通过引用调用函数?

    我写了以下代码
  • try 和 catch 中的对象声明未在范围内定义

    我想在 try catch 语句中声明一个对象 如下所示 try Object object value catch exception return 1 object usingExemple G 告诉我对象未在范围内定义 我确实明白 如
  • 为共享库文件(*.so)生成头文件(*.h)

    我有共享库文件 libmylib so 但没有头文件 mylib h 为了它 您知道从共享库文件生成此头文件的一些方法 工具吗 这通常是不可能的 因为 so 文件不包含有关参数列表的足够信息 特别是如果使用非标准类型 例如结构 因为类型信息
  • Android WebView err_unknown_url_scheme

    使用下面的简单代码 我可以正确加载我的网址 但是 当尝试点击以开头的 html 链接时 我收到 ERR UNKNOWN URL SCHEME mailto 微信 and tg 电报 有人可以帮我解决这个问题吗 不幸的是我根本不懂Java T
  • 如何在 Jersey 2.4 过滤器中获取资源注释?

    我的问题本质上与这个问题相同 如何在 Jersey ContainerResponseFilter 中获取资源注释 但我使用的是 Java Jersey 2 4 找不到 ResourceFilterFactory 或 ResourceFil
  • 如何让 C# 中的进程(而不是线程)同步文件系统访问

    今天早些时候 我正在调试一些类似这样的东西 class Foo void AccessCriticalSection try if IO File Exists path to lock txt throw new Exception Sy
  • 如何在flutter中使用where和orderby

    如何在flutter中使用where和orderBy 任何人都可以告诉我这些索引是如何工作的以及如何正确创建它们 Query query Firestore instance collection clients where sequenc
  • Xamarin MvvmCross Android 防止后退按钮返回到上一个视图

    我正在尝试为以下情况创建一个简洁的解决方案 我构建了一个需要凭据来验证用户身份的应用程序 每当 API 想要重新验证用户身份时 我想强制用户返回登录视图 此功能效果很好 但是当用户按下设备上的后退按钮时 会显示上一个视图 我希望看到当用户按
  • Lateinit 属性数据尚未初始化

    使用 Retrofit2 和 rxjava2 未在 Recyclerview 中设置 Gson Convertable 数据 然后通过其订阅给出错误 UninitializedPropertyAccessException lateinit
  • 如何从文本中删除所有 a href 标签

    我有一个脚本来替换 href 标签中的单词 不过 我想完全删除 a href 这样您就可以看到没有链接的 Google 一词 from BeautifulSoup import BeautifulSoup soup BeautifulSou