解析 URI 参数和关键字值对

2023-12-12

我想解析文本文件中 URI/L 的参数和关键字值。还应包括没有值的参数。 Python 很好，但我愿意接受使用其他工具的建议，例如 Perl 或单行代码也可以解决这个问题。

示例来源：

www.domain.com/folder/page.php?date=2012-11-20
www2.domain.edu/folder/folder/page.php?l=user&x=0&id=1&page=http%3A//domain.com/page.html&unique=123456&refer=http%3A//domain2.net/results.aspx%3Fq%3Dbob+test+1.21+some%26file%3Dname&text=
www.domain.edu/some/folder/image.php?l=adm&y=5&id=2&page=http%3A//support.domain.com/downloads/index.asp&unique=12345
blog.news.org/news/calendar.php?view=month&date=2011-12-10

输出示例：

date=2012-11-20
l=user
x=0
page=http%3A//domain.com/page.html&unique=123456
refer=http%3A//domain2.net/results.aspx%3Fq%3Dbob+test+1.21+some%26file%3Dname
test=
l=adm
y=5
id=2
page=http%3A//support.domain.com/downloads/index.asp
unique=12345
view=month
date=2011-12-10

您不需要深入脆弱的正则表达式世界。

urlparse.parse_qsl()是完成这项工作的工具（urllib.quote()有助于转义特殊字符）：

from urllib import quote
from urlparse import parse_qsl, urlparse


with open('links.txt') as f:
    for url in f:
        params = parse_qsl(urlparse(url.strip()).query, keep_blank_values=True)
        for key, value in params:
            print "%s=%s" % (key, quote(value))

Prints:

date=2012-11-20
l=user
x=0
id=1
page=http%3A//domain.com/page.html
unique=123456
refer=http%3A//domain2.net/results.aspx%3Fq%3Dbob%20test%201.21%20some%26file%3Dname
text=
l=adm
y=5
id=2
page=http%3A//support.domain.com/downloads/index.asp
unique=12345
view=month
date=2011-12-10

希望有帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

URL

解析 URI 参数和关键字值对的相关文章

更改随机森林分类器的阈值

我需要开发一个没有或接近没有假阴性值的模型为此我绘制了召回率精度曲线并确定阈值应设置为 0 11 我的问题是如何定义模型训练时的阈值稍后在评估时定义它是没有意义的因为它不会反映新数据 X train X test y tr
漂亮的地图打印机会抛出类型错误

我已经使用配置了漂亮的打印机http wiki eclipse org CDT User FAQ How can I inspect the contents of STL containers 3F http wiki eclipse o
将 Poetry 与 PyEnv 一起使用并遇到 Python 版本问题

我正在使用 WSL2 Ubuntu 我一直在学习使用 Fastapi 进行后端 API 开发的课程我相信我的 Ubuntu 默认 python 是 3 8 我正在尝试使用 python 3 10 0 进行开发我做了以下事情 pyenv安
matplotlib：调整图形窗口大小而不缩放图形内容

当您调整图形大小时 Matplotlib 会自动缩放图形窗口中的所有内容通常这是用户想要的但我经常想增加窗口的大小为其他东西腾出更多空间在这种情况下我希望在更改窗口大小时预先存在的内容保持相同的大小有谁知道一个干净的方法来做到这
在Python中不断寻找用户输入

我将如何编写一个始终寻找用户输入的 Python 程序我想我希望有一个等于输入的变量然后根据该变量的等于值会发生不同的情况因此如果变量是 w 那么它将执行某个命令并继续执行直到收到另一个输入例如 d 然后会发生不同的情况但直到
Pygame 让精灵按照给定的旋转行走

很久以前我做了一个Scratch脚本我想用Pygame将其转换为Python 有很多示例显示图像的旋转但我想知道如何更改精灵的旋转以使其沿给定方向移动而不更改图像这是我的暂存代码这是我的 Pygame 精灵类 class Star
如何在python中确定过去的时区特定日期是否是夏令时？

有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
Seaborn regplot 中点和线的不同颜色

中列出的所有示例西伯恩的regplot文档 https seaborn pydata org generated seaborn regplot html点和回归线显示相同的颜色改变color争论改变了两者如何为点设置与线不同的颜色你
更改 numpy 数组的结构强制给定值

如何缩小栅格数据的比例4 X 6大小成2 X 3如果 2 2 像素内的任何元素包含 1 则大小强制选择 1 否则选择 0 import numpy as np data np array 0 0 1 1 0 0 1 0 0 1 0 0 1
将相同的 Patch 实例添加到 matplotlib 中的多个子图中

我正在尝试将补丁的相同实例添加到 matplotlib 中的多个轴这是最小的例子 import matplotlib pyplot as mpl plt import matplotlib patches as mpl patches f
如何在每次运行 python 程序时添加新列

我希望我的表的第一列作为卷号第二列作为名称每当我运行 python 程序时我想在表中添加一列日期在这个新列中我想填充从 user list 获得的列表将包含值 P A P P 等如何处理我尝试首先通过 alter 命令添加一列
如何不断地将 STDOUT 发送到我的 python TCP 服务器？

我有简单的 python echo 服务器它使用套接字并向客户端回显随机数我有另一个程序每 2 秒将值打印到标准输出如果它只是一个脚本我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
将带有 md5 消息摘要和 DESede/CBC/PKCS5Padding 的 3DES 加密的 java 代码转换为 python

我有这个工作java代码它使用3DES加密对密码进行加密 import java security MessageDigest import java util Arrays import java util Base64 import
使用 Python 导入包含文本和数字数据的文件

I have a txt file which has text data and numerical data The first two rows of the file have essential information in te
如何在自定义 django 命令中抽象出命令代码

我正在我的应用程序下编写自定义 django 命令management commands目录目前我在该目录中有 6 个不同的文件每个文件都有不同的命令来解决独特的需求然而有一些实用程序是它们所共有的抽象出这些公共代码的最佳方法是什
向结构化 numpy 数组添加字段

将字段添加到结构化 numpy 数组的最简洁方法是什么是否可以破坏性地完成或者是否有必要创建一个新数组并复制现有字段每个字段的内容是否连续存储在内存中以便可以有效地完成此类复制如果您使用 numpy 1 3 还有 numpy li
从 python 文件调用 Julia 函数

我能够创建一个 docker 环境然后按照这个线程我有一个用 Julia 编写的高性能函数如何从 Python 中使用它 https stackoverflow com questions 64241264 i have a high
访问影子 DOM 中的元素

是否有可能查找 Shadow DOM 中的元素与蟒蛇硒示例用例我有这个input with type date
AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题这是我在js中的实现附加 iv 与加密消息并使用 base64 进行编码
具有重复值的 Sqlite 列

就说专栏吧aSQLite 数据库的非常重复始终有相同的 4 个值其他值可能稍后出现但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim

随机推荐

TFrecord 比原始 JPEG 图像占用更多空间

我正在尝试将 Jpeg 图像集转换为 TFrecords 但 TFrecord 文件占用的空间几乎是图像集的 5 倍经过大量谷歌搜索后我了解到当 JPEG 被写入 TFrecords 时它们就不再是 JPEG 了但是我还没有遇到这个
如何子类化 matplotlib 的图形类？

我正在尝试向我的图形添加一些自定义行为和属性但我无法决定有效的和Pythonic 方法我的第一个冲动是简单地子类化matplotlib figure Figure但我不知道如何实现这一点我通常创建新的图形并用类似的东西开始我的绘图
.gitattributes：merge=我们的策略与快进合并

如果我处于这样的 git 情况 da6a750 A Further in A okay for merging back into master bf27b58 Merge branch master into A 86294d1 HEAD
无法使用沙盒帐户

我真的需要你们的帮助两个小时以来我遇到了一个与 Paypal Sandbox 相关的非常奇怪的问题我在堆栈溢出上阅读了很多答案但没有一个对我有帮助我将尝试解释我的问题当我创建一个新的沙箱帐户尊重密码强度负载平衡等所有规则时
序列化数组以将它们存储在数据库中的意义是什么？

我看到人们存储数组的方式如下 a 6 i 0 s 5 11148 i 1 s 5 11149 i 2 s 5 11150 i 3 s 5 11153 i 4 s 5 11152 i 5 s 5 11160 为什么他们不能是 11148 11
Cython 中数组的总和

我正在尝试找到使用 Cython 水平求和 numpy 数组数组的最快方法首先假设我有一个随机浮点数 10 x 100 000 的二维数组我可以创建一个object数组每一列作为数组中的值如下所示 n 10 5 a np rand
如果名称变量以下划线为前缀，则 Bean 验证不起作用

我正在尝试一些 bean 验证但我偶然发现了奇怪的行为我正在使用 Glassfish 和 Primefaces 作为前端如果有什么区别的话在我的项目的其他地方我使用 Hibernate validator 我不确定它是否正在验
垃圾收集器 C#，有关“清除”对象的问题

我阅读了一些有关垃圾收集的信息它是如何工作的等我尝试通过我的示例了解它是如何工作的但我认为我有问题我知道垃圾收集器在以下情况下运行内存不够你调用GC Collect 这是我的代码 public partial class For
为什么 trySend 会发出假数据？

我需要在 MVVM 中获取用户身份验证状态在存储库中我这样做 override fun getAuthResponse callbackFlow val listener AuthStateListener Log d TAG curre
在数据库中保存塞尔维亚拉丁字符

我在数据库中保存塞尔维亚拉丁字符时遇到问题但只有当我从 jsf 应用程序保存它时才会出现问题当我直接使用 SQLyog 在数据库中插入一些行时一切都很好当我尝试从应用程序插入某些内容而不是字符时 and 在数据库中插入问号另一方面
jqgrid服务器异常错误消息

有没有办法在我的 jqGrid 中显示从服务器发送的自定义异常消息我的一个函数执行 throws 子句并抛出一些异常我需要显示与此抛出的异常相关的错误消息有没有办法在 jqGrid 中做到这一点您没有指定在哪个 jqGrid 操作中
START_STICKY 和 START_NOT_STICKY

有什么区别START STICKY and START NOT STICKY在android中实现服务时谁能指出一些标准示例这两个代码仅在手机内存不足并在服务完成执行之前终止服务时才相关 START STICKY告诉操作系统在有足够的内
在scala中序列化优先级队列

我正在尝试序列化一个可变的PriorityQueue在 scala 2 10 中我得到了NotSerializableException将对象写入 ObjectOutputStream 时我做了一个简单的测试用例 import java
如何在 Zend Framework 2 中访问路由、发布、获取等参数

zf2中如何获取与页面请求相关的各种参数像 post get 参数正在访问的路由发送的标头和上传的文件最简单的方法是使用参数插件在 beta5 中引入它具有实用方法可以轻松访问不同类型的参数一如既往读书测试对于理解某物应该
我应该使用事件、信号量、锁、条件或其组合来管理安全退出多线程 Python 程序吗？

我正在编写一个多线程Python程序其中主线程和它生成的其他线程作为守护进程运行但不是Thread daemon True 它们在某些目录中查找某些文件并在它们存在时对其执行操作一个任何线程中可能会发生错误这将需要整个程序退出
如何使用 MASM 在控制台上进行输入/输出？ [关闭]

Closed 这个问题需要多问focused 目前不接受答案我用谷歌搜索了又搜索但没有发现任何有用的东西如何将输出发送到控制台并通过程序集接受来自控制台的用户输入我正在使用 MASM32 正如 filofel 所说使用 Win3
比较在 Three.js 中创建天空盒材质的方法

当谈到在 Three js 中制作天空盒时我看到了两种不同的思想流派假设我们有代码 var imagePrefix images mountains var directions xpos xneg ypos yneg zpos zne
反应改变数组中的状态（for循环）

我有一个有航班的州并且有一个滑块可以更改最高价格以更改航班元素的可见性 maxpriceFilter var flightOffer this state flightOffer var sliderPrice this state sl
如何在 C++ 中将加载到内存中的图像文件转换为 ID2D1Bitmap

我正在尝试将刚刚从压缩文件提取到内存中的图像文件 png 但可以是任何东西转换为 ID2D1Bitmap 以便使用 Direct 2D 进行绘制我试图寻找一些文档但我只能找到接收 const char path 或询问我图像的宽度和高
解析 URI 参数和关键字值对

我想解析文本文件中 URI L 的参数和关键字值还应包括没有值的参数 Python 很好但我愿意接受使用其他工具的建议例如 Perl 或单行代码也可以解决这个问题示例来源 www domain com folder page php

解析 URI 参数和关键字值对

解析 URI 参数和关键字值对 的相关文章

随机推荐

热门标签

解析 URI 参数和关键字值对的相关文章