如何将 BeautifulSoup.ResultSet 转换为字符串

2024-02-22

所以我解析了一个html页面.findAll(BeautifulSoup) 到名为变量result。如果我输入result在 Python shell 中然后按 Enter，我看到了预期的普通文本，但是当我想将此结果作为字符串对象进行后处理时，我注意到str(result)返回垃圾，就像这个示例：

\xd1\x87\xd0\xb8\xd0\xbb\xd0\xbd\xd0\xb8\xd1\x86\xd0\xb0</a><br />\n<hr />\n</div>

Html页面源是utf-8 encoded

我该如何处理这个问题？

代码基本上是这样的，以防万一：

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib.open(url).read())
result = soup.findAll(something)

Python 是 2.7

Python 2.6.7 美丽的汤。version 3.2.0

这对我有用：

unicode.join(u'\n',map(unicode,result))

我很确定result is a BeautifulSoup.ResultSet对象，它似乎是标准Python列表的扩展

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

beautifulsoup

如何将 BeautifulSoup.ResultSet 转换为字符串的相关文章

在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
如何将 Unicode 字符转换为简单形式？ [复制]

这个问题在这里已经有答案了有没有一个Go库可以Sj str m作为输入和返回Sjostrom作为输出您可以使用golang org x text unicode norm来处理这个问题 package main import fmt i
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor

随机推荐

jquery .click 覆盖锚点 href 当我不想要它时！

我有一组嵌套的 DIV 当用户单击它们时它们使用 jQuery 进行滑动切换在最里面的 DIV 内有一个带有 HREF 的锚标记可以导航到某个位置问题是当我单击链接时它会像父 DIV 一样滑动切换而不是导航到 url 如果我右
如何找到矩阵元胞数组中每个维度的最大值？

我得到一个元胞数组A由不同大小的矩阵组成例如我可以有一个三元素元胞数组其中每个元素的维度为 A 1 gt 4 x 3 A 2 gt 16 x 4 A 3 gt 5 x 14 我将如何遍历元胞数组并返回最大值每个维度全面的例如示例中
在自定义列表视图中一次仅选择一个单选按钮，android

我正在尝试制作自定义列表视图列表视图中的每个条目都有一个图像视图一个文本视图和一个单选按钮我终于列出了列表但现在我在选择单选按钮时遇到了问题我想要的是每当用户单击条目中的任意位置时这应该设置相应的单选按钮并自动取消选择列表中的其
创建后更改 google-analytics TrackingId

描述我有一个使用 googleanalytics 代码的单页应用程序该应用程序适用于 4 个不同国家的顶级域名例如www example de www example at www example be 等也可以在不更改域名的情况下
等待循环点击

在开始之前我知道已经有一个thread https stackoverflow com questions 19509296 wait for a user event关于这一点但不幸的是它对我没有任何帮助所以这是我的问题我有一个用
如何从 Laravel 项目中公共图像的 URL 中删除 /storage？

我想要实现的目标是从 URL 中删除 storage 以便最终它是www example com images x jpg而不是默认的www example com storage x jpg 我尝试从 storage 中删除url in
IE中Excel导出问题

我有这个脚本可以将mysql数据导出到excel 我努力了一切但我无法让这个脚本适用于 IE 这脚本使用 FireFox 或 Chrome 下载数据但 IE 失败并且说 Internet Explorer 无法从 www mysi
堆栈跟踪中的神秘行

While 调查堆栈跟踪差异 https stackoverflow com questions 42462750 why java enum need to check class and declaringclass in compar
设置 google.visualization.DataTable 的列宽

我想更改 google visualization DataTable 中列的宽度但是我不知道该怎么做 Fiddler https jsfiddle net dgbh6sL0 1 https jsfiddle net dgbh6sL0 1
viewDidLoad 在启动时在 rootViewController 上被调用两次

有谁知道为什么这个根View Controller s viewDidLoad启动时被调用两次这让我发疯这是从第一次到的堆栈跟踪viewDidLoad 0 0x0000276a in RootViewController viewDid
JavaScript 中的鼠标光标位置？

如何在javascript中获取光标X和Y var curX ns6 e pageX event clientX ietruebody scrollLeft var curY ns6 e pageY event clientY ietrue
从字典的字典创建内部值的列表

我试图找出字典内部值的最大值和最小值dicts The dict看起来像这样 ALLEN PHILLIP K bonus 4175000 exercised stock options 1729541 expenses 13868 BADU
为什么 MongoDb 文档 id 前面有一个下划线？

为什么 MongoDb 文档 id 前面有一个下划线为什么不称其为 id 而不是 id 这是我不知道的命名约定的一部分吗您可能会注意到 MongoDB 有很多函数在 shell 中和字段以 understore 开头表示它们是内部
如何在 WordPress 中创建自定义用户角色 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我必须在 WordPress 中为用户创建审阅者自定义角色如何创建自定义规则您可以使用add role https devel
带有参数 url 创建的 symfony2 twig 路径

我得到以下信息 a href Aktivieren a creates 后端类别激活 8 1 然后我得到了 a href 这创造了类别 id 1 看到不同我想要的是在第二种情况下与第一种情况完全相同类别 1 我该如何处理这个问题
在 C# 中查询事件日志中消息内容的最简单方法是什么？

我对感兴趣编写一些代码来查询 Windows 事件日志以获取特定的错误消息内容如中所述这篇 MSDN 文章 http msdn microsoft com en us library bb671200 28v vs 90 29 aspx
Django 中的 {% %} 和 {{ }}

我正在学习 Django 遇到了 2 组特殊字符我以前从未见过这样使用过我可以猜测它们在示例中的用途但不了解它们的范围他们是 if registered user form as p 我添加了if registered and us
为什么“inline-block”元素会自动清除它们的子元素？

display inline block用于许多clearfixes 1 http css tricks com snippets css clear fix 2 http perishablepress com lessons learn
asp.net 中的后台工作者（线程池）

我有一个 ASP NET Web 表单它将大约 25 30 个项目包含用户从表单发出后续请求时所需的信息写入自定义缓存中目前所有这些都是在主线程上同步发生的但在较高负载下 addcache 正在成为瓶颈如何在后台运行此任务而不
如何将 BeautifulSoup.ResultSet 转换为字符串

所以我解析了一个html页面 findAll BeautifulSoup 到名为变量result 如果我输入result在 Python shell 中然后按 Enter 我看到了预期的普通文本但是当我想将此结果作为字符串对象进行后处理时

如何将 BeautifulSoup.ResultSet 转换为字符串

如何将 BeautifulSoup.ResultSet 转换为字符串 的相关文章

随机推荐

热门标签

如何将 BeautifulSoup.ResultSet 转换为字符串的相关文章