如何将 BeautifulSoup.ResultSet 转换为字符串

2024-02-22

所以我解析了一个html页面.findAll(BeautifulSoup) 到名为变量result。 如果我输入result在 Python shell 中然后按 Enter,我看到了预期的普通文本,但是当我想将此结果作为字符串对象进行后处理时,我注意到str(result)返回垃圾,就像这个示例:

\xd1\x87\xd0\xb8\xd0\xbb\xd0\xbd\xd0\xb8\xd1\x86\xd0\xb0</a><br />\n<hr />\n</div>

Html页面源是utf-8 encoded

我该如何处理这个问题?


代码基本上是这样的,以防万一:

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib.open(url).read())
result = soup.findAll(something)

Python 是 2.7


Python 2.6.7 美丽的汤。version 3.2.0

这对我有用:

unicode.join(u'\n',map(unicode,result))

我很确定result is a BeautifulSoup.ResultSet对象,它似乎是标准Python列表的扩展

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 BeautifulSoup.ResultSet 转换为字符串 的相关文章

  • 在 python 3 中使用子进程

    我使用 subprocess 模块在 python 3 中运行 shell 命令 这是我的代码 import subprocess filename somename py in practical i m using a real fil
  • cv2.drawContours() - 取消填充字符内的圆圈(Python,OpenCV)

    根据 Silencer的建议 我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
  • 小部件之间的自定义信号

    尝试将信号从一个 gtk EventBox 子级发送到另一个 在 init HeadMode 第 75 行 上出现错误 类型错误 未知信号名称 消息发送 why usr bin env python coding utf8 import p
  • 编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

    使用 Jupyter Notebook 时 VSCode 中缺少 在选择中查找 按钮 它会减慢开发速度 所以我想请问有人知道如何激活它吗 第一张图显示了在 python 文件中的搜索 替换 第二张图显示了笔记本电脑中缺少的按钮 Python
  • Pandas:如何将数据框插入 Clickhouse

    我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
  • Alembic:如何迁移模型中的自定义类型?

    My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
  • 揭秘sharedctypes性能

    在 python 中 可以在多个进程之间共享 ctypes 对象 然而我注意到分配这些对象似乎非常昂贵 考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
  • 对使用 importlib.util 导入的对象进行酸洗

    我在使用Python的pickle时遇到了一个问题 我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块 如下所示 import importlib util spec importlib util sp
  • 如何使用 Bokeh 动态隐藏字形和图例项

    我正在尝试在散景中实现复选框 其中每个复选框应显示 隐藏与其关联的行 我知道可以通过图例来实现这一点 但我希望这种效果同时在两个图中发生 此外 图例也应该更新 在下面的示例中 出现了复选框 但不执行任何操作 我显然不明白如何更新用作源的数据
  • GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

    我发现计算的梯度取决于 tf function 装饰器的相互作用 如下所示 首先 我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
  • Python:我不明白 sum() 的完整用法

    当然 我明白你使用 sum 与几个数字 然后它总结所有 但我正在查看它的文档 我发现了这一点 sum iterable start 第二个参数 start 的作用是什么 这太尴尬了 但我似乎无法通过谷歌找到任何示例 并且对于尝试学习该语言的
  • 使用 Conda 更新特定模块会删除大量软件包

    我最近开始使用 Anaconda Python 发行版 因为它提供了许多开箱即用的数据分析库 使用 conda 创建环境和安装软件包也轻而易举 但是当我想更新 Python 本身或任何其他模块时 我遇到了一些严重的问题 我事先被告知我的很多
  • `pyqt5'错误`元数据生成失败`

    我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统 我怀疑M1芯片可能是原因 我收到一个错误metadata generation failed 最小工作示例 directly in the t
  • 使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目,例如哈佛风格

    我正在使用 Django 并将 bibtex 存储在我的模型中 并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用 使其看起来像哈佛引用样式 使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
  • 如何将 Unicode 字符转换为简单形式? [复制]

    这个问题在这里已经有答案了 有没有一个Go库可以Sj str m作为输入和返回Sjostrom作为输出 您可以使用golang org x text unicode norm来处理这个问题 package main import fmt i
  • sqlite3从打印数据中删除括号

    我创建了一个脚本 用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
  • Python对象初始化性能

    我只是做了一些快速的性能测试 我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍 这些可能是错误的术语 我不确定这里的行话 例如 gt gt gt import timeit gt gt gt print timeit timeit
  • OSX 上的 locale.getlocale() 问题

    我需要获取系统区域设置来执行许多操作 最终我想使用 gettext 翻译我的应用程序 我打算在 Linux 和 OSX 上分发它 但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
  • 从列表python的单个列表中删除子列表

    我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时 它不适用于我
  • 计算互相关函数?

    In R 我在用ccf or acf计算成对互相关函数 以便我可以找出哪个移位给我带来最大值 从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西 或者我应该使用fft模块 目前 我正在这样做 xcor

随机推荐

  • jquery .click 覆盖锚点 href 当我不想要它时!

    我有一组嵌套的 DIV 当用户单击它们时 它们使用 jQuery 进行滑动切换 在最里面的 DIV 内有一个带有 HREF 的锚标记 可以导航到某个位置 问题是 当我单击链接时 它会像父 DIV 一样滑动切换 而不是导航到 url 如果我右
  • 如何找到矩阵元胞数组中每个维度的最大值?

    我得到一个元胞数组A由不同大小的矩阵组成 例如 我可以有一个三元素元胞数组 其中每个元素的维度为 A 1 gt 4 x 3 A 2 gt 16 x 4 A 3 gt 5 x 14 我将如何遍历元胞数组并返回最大值每个维度全面的 例如 示例中
  • 在自定义列表视图中一次仅选择一个单选按钮,android

    我正在尝试制作自定义列表视图 列表视图中的每个条目都有一个图像视图 一个文本视图和一个单选按钮 我终于列出了列表 但现在我在选择单选按钮时遇到了问题 我想要的是每当用户单击条目中的任意位置时 这应该设置相应的单选按钮并自动取消选择列表中的其
  • 创建后更改 google-analytics TrackingId

    描述 我有一个使用 googleanalytics 代码的单页应用程序 该应用程序适用于 4 个不同国家的顶级域名 例如www example de www example at www example be 等 也可以在不更改域名的情况下
  • 等待循环点击

    在开始之前 我知道已经有一个thread https stackoverflow com questions 19509296 wait for a user event关于这一点 但不幸的是它对我没有任何帮助 所以这是我的问题 我有一个用
  • 如何从 Laravel 项目中公共图像的 URL 中删除 /storage?

    我想要实现的目标是从 URL 中删除 storage 以便最终它是www example com images x jpg而不是默认的www example com storage x jpg 我尝试从 storage 中删除url in
  • IE中Excel导出问题

    我有这个脚本可以将mysql数据导出到excel 我努力了 一切 但我无法让这个脚本适用于 IE 这 脚本使用 FireFox 或 Chrome 下载数据 但 IE 失败并且 说 Internet Explorer 无法从 www mysi
  • 堆栈跟踪中的神秘行

    While 调查堆栈跟踪差异 https stackoverflow com questions 42462750 why java enum need to check class and declaringclass in compar
  • 设置 google.visualization.DataTable 的列宽

    我想更改 google visualization DataTable 中列的宽度 但是我不知道该怎么做 Fiddler https jsfiddle net dgbh6sL0 1 https jsfiddle net dgbh6sL0 1
  • viewDidLoad 在启动时在 rootViewController 上被调用两次

    有谁知道为什么这个根View Controller s viewDidLoad启动时被调用两次 这让我发疯 这是从第一次到的堆栈跟踪viewDidLoad 0 0x0000276a in RootViewController viewDid
  • JavaScript 中的鼠标光标位置?

    如何在javascript中获取光标X和Y var curX ns6 e pageX event clientX ietruebody scrollLeft var curY ns6 e pageY event clientY ietrue
  • 从字典的字典创建内部值的列表

    我试图找出字典内部值的最大值和最小值dicts The dict看起来像这样 ALLEN PHILLIP K bonus 4175000 exercised stock options 1729541 expenses 13868 BADU
  • 为什么 MongoDb 文档 id 前面有一个下划线?

    为什么 MongoDb 文档 id 前面有一个下划线 为什么不称其为 id 而不是 id 这是我不知道的命名约定的一部分吗 您可能会注意到 MongoDB 有很多函数 在 shell 中 和字段以 understore 开头 表示它们是内部
  • 如何在 WordPress 中创建自定义用户角色 [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我必须在 WordPress 中为用户创建审阅者 自定义 角色 如何创建自定义规则 您可以使用add role https devel
  • 带有参数 url 创建的 symfony2 twig 路径

    我得到以下信息 a href Aktivieren a creates 后端 类别 激活 8 1 然后我得到了 a href 这创造了 类别 id 1 看到不同 我想要的是在第二种情况下与第一种情况完全相同 类别 1 我该如何处理这个问题
  • 在 C# 中查询事件日志中消息内容的最简单方法是什么?

    我对 感兴趣编写一些代码来查询 Windows 事件日志以获取特定的错误消息内容 如中所述这篇 MSDN 文章 http msdn microsoft com en us library bb671200 28v vs 90 29 aspx
  • Django 中的 {% %} 和 {{ }}

    我正在学习 Django 遇到了 2 组特殊字符 我以前从未见过这样使用过 我可以猜测它们在示例中的用途 但不了解它们的范围 他们是 if registered user form as p 我添加了if registered and us
  • 为什么“inline-block”元素会自动清除它们的子元素?

    display inline block用于许多clearfixes 1 http css tricks com snippets css clear fix 2 http perishablepress com lessons learn
  • asp.net 中的后台工作者(线程池)

    我有一个 ASP NET Web 表单 它将大约 25 30 个项目 包含用户从表单发出后续请求时所需的信息 写入自定义缓存中 目前 所有这些都是在主线程上同步发生的 但在较高负载下 addcache 正在成为瓶颈 如何在后台运行此任务而不
  • 如何将 BeautifulSoup.ResultSet 转换为字符串

    所以我解析了一个html页面 findAll BeautifulSoup 到名为变量result 如果我输入result在 Python shell 中然后按 Enter 我看到了预期的普通文本 但是当我想将此结果作为字符串对象进行后处理时