Python 的“re”模块不起作用？

2024-04-21

我使用 Python 的“re”模块，如下所示：

request = get("http://www.allmusic.com/album/warning-mw0000106792")
print re.findall('<hgroup>(.*?)</hgroup>', request)

我所做的就是获取 HTML这个网站 http://www.allmusic.com/album/warning-mw0000106792，并寻找这个特定的代码片段：

<hgroup>
    <h3 class="album-artist">
        <a href="http://www.allmusic.com/artist/green-day-mn0000154544">Green Day</a>        </h3>

    <h2 class="album-title">
        Warning        </h2>
</hgroup>

但是，它继续打印一个空数组。为什么是这样？为什么 re.findall 找不到这个片段？

您正在解析的 HTML 分为多行。您需要通过re.DOTALL标记为findall像这样：

print re.findall('<hgroup>(.*?)</hgroup>', request, re.DOTALL)

这允许.匹配换行符，并返回正确的输出。

当然，@jsalonen 是对的，用正则表达式解析 HTML 是一个棘手的问题。然而，在像这样的小情况下，特别是对于一次性脚本，我认为这是可以接受的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

GET

Python 的“re”模块不起作用？的相关文章

SQLAlchemy 闭包表关系定义

我最近开始使用 SQL Alchemy 开展一个涉及攀岩区域和路线的项目区域是分层的因为单个区域可以包含多个区域而多个区域又可以包含其他区域路线直接与单个区域关联但也与该区域的父区域关联等等为了实现这一点我选择使用Bill
pandas 用 nan 值切割了一系列

我想将 pandas cut 函数应用于包含 NaN 的序列期望的行为是它对非 NaN 元素进行存储并为 NaN 元素返回 NaN import pandas as pd numbers with nan pd Series 3 1 2
无法从同一项目的 bin 目录导入模块

我正在构建一个库该库将通过 pip 包含在其他项目中我有以下目录 venv 是 virtualenv project bin run py myproj init py logger py venv 我激活虚拟环境在 bin run
Bokeh 相当于 matplotlib 子图

我正在寻找一种方法来创建包含多个子图的绘图例如 fig ax0 ax1 plt subplots nrows 2 sharex True 可以在 matplotlib 中完成然后可以通过以下方式解决ax0 and ax1 有没有办法在
ANSI C，整数到字符串，不带可变参数函数

我目前正在使用支持 ANSI C 的 PLC 但使用它自己的 GNU 编译器风格它不编译任何可变参数函数和 itoa 之类的东西所以使用 sprintf co 不是将整数转换为字符串的选项任何人都可以引导我到一个列出了健壮的无 sp
chrome_options.binary_location() TypeError: 'str' 对象不可调用

我希望每个人都好我是 python 新手我尝试运行这段代码但我不明白问题是什么以及如何解决这个问题我的代码是 from selenium import webdriver from time import sleep url raw
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
如何读取 10 位原始图像？其中包含 RGB-IR 数据

我想知道如何从我的 10 位原始它有 rgb ir 图像数据数据中提取 RGB 图像如何使用 Python 或 MATLAB 进行阅读拍摄时的相机分辨率为 1280x720 室内照片图片下载 https drive google c
对seaborn图中的分类x轴进行排序

我正在尝试使用 seaborn 散点图绘制数据框中前 30 的值如下所示同一图的可重现代码 import seaborn as sns df sns load dataset iris function to return top 30
在 PostgreSQL 中获取 JSONB 的精简版本

如何获取紧凑型JSONB from PostgreSQL 获取时我得到的只是空格 SELECT data FROM a table WHERE id 1 data is JSONB column unique bla bla foo bar
如何开始使用“scipy”

我之前安装过 Python 3 4 2 和 3 5 2 在这两种情况下我都可以在 Idle 中涉足编写和测试代码这给了我两个窗口一个用于代码的运行窗口一个用于交互和测试的 Shell 窗口输出抱歉不确定术语是否正确现在我
如何在 Django 中创建多选框？

我正在尝试创建多选框字段来自姜戈选择 2 https github com applegrew django select2库如下图所示我使用了下一个代码但它返回简单的选择多个小部件我想我忘了补充一些东西我的错误在哪里有人可以告诉
PHP 中字符串中的类常量

我的阅读手册 http www php net manual en language types string php language types string parsing 标题字符串访问和按字符修改之前的部分是您可以在字符串
PyCharm 可以列出项目中的所有 Python 错误吗？

我在虚拟环境中使用 python 2 7 和 PyCharm 2 7 2013 年 2 月 7 日的新版本每当我打开其中有明确错误的Python文件相当于其他语言中的编译错误例如使用未声明的变量调用不存在的函数时它会在文件的装订
返回 OSError 异常类的子类实例的逻辑在哪里？

我一直在寻找一些对某些人来说可能相对愚蠢的东西但对我来说非常有趣输入和输出错误已合并为OSError在 Python 3 3 中异常类层次结构发生了变化关于内置类的一个有趣的特性OSError是这样它在传递时返回它的子类errno
当前异常上下文掩盖了先前的错误

以下是我在 Doug Hellman 网站上名为 masking exceptions catch py 的文件中找到的示例我暂时无法找到链接 throws 中引发的异常将被丢弃而 cleanup 中引发的异常将被报告道格在他的文章中
捕获 CommandOnCooldown 错误

我正在制作一个有冷却时间的不和谐机器人并且我正在尝试制作一个事件当CommandOnCooldown发生错误时机器人会通过私信告诉他们需要等待多长时间这是我的代码看起来一切正常但它不知道 retry after 意味着什么 bo
如何在 Python Paramiko 中配置 ssh StrictHostKeyChecking=no 的等效项

我正在使用 Paramiko 通过 Python 脚本进行 sshing 我的ssh命令如下 ssh A o strictHostKeyChecking no
从 C++ 检索 Python 类型

这个问题实际上是以下两个问题的延伸如何在 Python 中实现 C 类以供 C 调用 https stackoverflow com questions 9040669 how can i implement a c class in
mpld3图，注释问题

我正在使用 mpld3 在 Intranet 网站上显示图形我正在使用将图形保存到字典并使用 mpld3 js 在客户端渲染它的选项除非我想使用注释否则该图呈现良好这些显然是抵消的我不明白为什么因为即使我将偏移量设置为 0 0

随机推荐

通过输入类型文件使用相机时 iOS 6 出现问题

我正在为 ipad 编写一个网络应用程序我需要在它上面使用相机拍照我的解决方案是使用 input type file 但问题是当 iOS 调出相机时它会自动更改方向当我完成拍照并返回到我的应用程序时应用程序会以纵向模式显示即使我以
cx_Freeze：使用 pytesseract 执行在其他 PC 上失败

我已经从我的 Python OCR 程序创建了一个可执行文件 import pytesseract 使用 cx Freeze 生成的 exe 在我自己的机器上运行良好为了测试该程序我制作了一个 zip 文件夹并在共享点上与一些朋友和同
带有简单数组初始化的 ng-options

我对 Angular 有点困惑ng options 我有一个简单的数组我想用它初始化一个选择但是我想要选项值标签脚本 js scope options var1 var2 var3 html
nivo slider - 将文本添加到滑块

我目前在主页上使用 nivo 滑块来显示不同的图像它工作完美不过图像旁边有一些文字我想跟随每张图片 HTML 代码如下 div class splash div class splash content div h1 More tr
Pandas：如何用该列的平均值替换列中的零值，对于所有具有零值的列

我有一个数据框其中多个值为零我想用该列的平均值替换零值而不重复代码我有一些名为运行时间预算和收入的列它们的值都为零我想用该列的平均值替换这些零值我尝试一次写一列如下所示 print df budget mean gt
使用 PREEMPT_RT 构建 RT 应用程序

我想在使用实时 PREEMPT RT 的同时编写实时 Linux 程序我找到了官方维基 https rt wiki kernel org index php HOWTO Build an RT application https rt w
float（或 double）可以设置为 NaN 吗？

注类似于C 中整数可以是 NaN 吗 https stackoverflow com questions 3949457 c can int be nan 我知道这没有什么实际目的但是可以float or double被设置为NaN F
在调用 'os.system()' 之前仅运行一些语句

我正在编写一个 Python 程序该程序具有使用 PyQt5 的 GUI 并且还使用 os system 调用 MATLAB 文件但是我的函数之一决定在调用 os system 之前不执行任何与 PyQt 相关的语句像 print
将密钥发送到 PowerShell 中打开的窗口

I made a program that opens a certain program then Ctrl C it after x amount of time 我现在正在使用这个 System Windows Forms SendK
Jackson 2.0 与 Jackson 1.x 注释的兼容性？

我有一个旧的框架类用 jackson 1 x 注释我的应用程序使用 jackson 2 0 来处理 json 序列化是否可以配置 jackson 2 0 以理解旧注释目前这些注释被简单地忽略没有开箱即用的配置但实现 Jack
OS X 中的原始套接字 sendto() 失败

当我在 OS X 上打开原始套接字构建自己的 udp 数据包标头和数据并调用 sendto 时我收到错误无效参数这是网站上的示例程序 rawudp c http www tenouk com Module43a html htt
我可以在服务器端应用程序（PHP、Ruby、Python 等）上读取 URL 的哈希部分吗？

假设 URL 为 www example com val 1 part2 PHP可以读取请求变量val1使用 GET 数组是哈希值part2还可读吗或者这仅取决于浏览器和 JavaScript 主要问题是浏览器甚至不会发送带有片段部分的
Powershell'不被识别为内部或外部命令、可运行程序或批处理文件

我正在尝试运行 powershell Command 来执行 powershell 文件作为 Visual studio 2013 中的构建后事件但我越来越 Powershell 不被识别为内部或外部命令可操作程序或批处理文件输出窗口
如何配置IdentityServer4的登录UI？

我找到的 IdentityServer4 使用示例MVC https github com IdentityServer IdentityServer4 Quickstart UI用于登录用户界面当 OpenIdConnect 隐式客户端
将 ID 自定义到 Firebase 实时数据库 [重复]

这个问题在这里已经有答案了我正在使用集成在移动应用和网络面板中的 Firebase 实时数据库默认情况下实时数据库上的唯一 ID 以此格式生成 Lup7ey2xRPO9Owm67xM 通过 Firebase 面板创建新寄存器时我可以
新的 Bootstrap 图标有可用的字体吗？

来自 Font Awesome 我想使用新的引导图标 https icons getbootstrap com 在我的网络项目中不幸的是就我必须插入的代码量而言包含 Bootstrap 图标似乎更加乏味我在寻找什么以图标为例bi
perl `require` 对于变量给定的文件

我想使用一个模块文件的路径将位于变量中我尝试使用这段代码 usr bin perl w use strict use Getopt Long my library zipped aid class file GetOptions aid
为什么自定义实现的 VaadinServiceInitListener 不在 vaadin 13.0.2 中监听？

我想验证用户是否已登录以实现它我在 vaadin 13 0 2 中找到了名为 VaadinServiceInitListener 的东西此类用于侦听所有 UI 的 BeforeEnter 事件以便在允许之前检查用户是否已登录进入任意页
Android - FirebaseApp / Firebase-初始化未启动

我想在我的 Android 应用程序中实现 Firebase Messaging 插件我从 github 上的 quickstart android master messaging 示例开始 https github com fireb
Python 的“re”模块不起作用？

我使用 Python 的 re 模块如下所示 request get http www allmusic com album warning mw0000106792 print re findall

Python 的“re”模块不起作用？

Python 的“re”模块不起作用？ 的相关文章

随机推荐

热门标签

Python 的“re”模块不起作用？的相关文章