如何在 python 中取消引用 urlencoded unicode 字符串?

2023-12-11

我有一个像“Tanım”这样的 unicode 字符串,它以某种方式编码为“Tan%u0131m”。我怎样才能把这个编码字符串转换回原来的unicode。 显然 urllib.unquote 不支持 unicode。


%uXXXX 是一个非标准编码方案尽管该实现仍然存在于 JavaScript 领域,但已被 w3c 拒绝。

更常见的技术似乎是对字符串进行 UTF-8 编码,然后使用 %XX 对结果字节进行 % 转义。该方案由 urllib.unquote 支持:

>>> urllib2.unquote("%0a")
'\n'

不幸的是,如果你真的need为了支持 %uXXXX,您可能需要使用自己的解码器。否则,简单地对你的 unicode 进行 UTF-8 编码,然后 % 转义生成的字节可能会更可取。

一个更完整的例子:

>>> u"Tanım"
u'Tan\u0131m'
>>> url = urllib.quote(u"Tanım".encode('utf8'))
>>> urllib.unquote(url).decode('utf8')
u'Tan\u0131m'
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 python 中取消引用 urlencoded unicode 字符串? 的相关文章

  • 函数名称未定义

    我有一段代码 看起来像这样 if name main main def main print hello 但是 当我尝试运行此代码时 出现错误 NameError 名称 main 未定义 我是否没有在函数 def main 的第一行定义名称
  • virtualenvwrapper 函数在 shell 脚本中不可用

    所以 我再一次制作了一个很棒的 python 程序 它让我的生活变得更加轻松 并节省了大量时间 当然 这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能 该项目有一个requiremen
  • 在 Python 中延迟转置列表

    所以 我有一个延迟生成的可迭代的三元组 我试图弄清楚如何将其转换为 3 个可迭代对象 分别由元组的第一个 第二个和第三个元素组成 然而 我希望这件事能懒惰地完成 所以 举例来说 我希望 1 2 3 4 5 6 7 8 9 将变成 1 4 7
  • 如何在plotly(python)中的刻度标签和图形之间添加空格?

    如果我使用绘图创建水平条形图 则每个条形的标签都与图表相对应 我想在标签和图表之间添加一些空间 填充 边距 我怎样才能做到这一点 Example import plotly offline as py import plotly graph
  • 在多核上运行 python 线程

    我知道Python 2 7不允许在不同的内核上运行多个线程 你需要使用multiprocessing模块以实现某种程度的并发性 我正在看concurrent futuresPython 3 4 中的模块 是否使用ThreadPoolExec
  • Asyncio:从未检索到任务异常的怪异

    假设我有一个简单的代码 import asyncio async def exc print 1 0 loop asyncio get event loop loop create task exc try loop run forever
  • argparse 不检查位置参数

    我正在创建一个脚本 它使用 argparse 接受位置参数和可选参数 我已经阅读了 Doug 的教程和 python 文档 但找不到答案 parser argparse ArgumentParser description script t
  • 右键单击 QPushButton 上的 contextMenu

    对于我的应用程序 我在 Qt Designer 中创建了一个 GUI 并将其转换为 python 2 6 代码 关于一些QPushButton 与设计器创建 我想添加右键单击上下文菜单 菜单选项取决于应用程序状态 如何实现这样的上下文菜单
  • Python FTP下载550错误

    我编写了一个 ftp 爬虫来下载特定文件 它会一直工作 直到找到要下载的特定文件 然后抛出此错误 ftplib error perm 550 该文件存在于我的下载文件夹中 但文件大小为 0 kb 我需要转换某些内容才能下载吗 我可以访问 f
  • 提高光线追踪命中功能的性能

    我有一个简单的 python 光线追踪器 渲染 200x200 的图像需要 4 分钟 这对于我的口味来说绝对是太多了 我想改善这种情况 几点 我为每个像素发射多条光线 以提供抗锯齿功能 每个像素总共发射 16 条光线 200x200x16
  • matplotlib vlines 图中未应用 y 轴的最小值

    我正在 matplotlib 中绘制 vlines 图 数据集中的所有 y 值如下 gt 0 我希望 y 轴最底部的刻度能够读取0 但相反 我得到 500 这是代码 usr bin env python import numpy as np
  • Pandas 中每列的曲线拟合 + 外推值

    我有一个包含大约 300 列的数据集 每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
  • 为什么 pip 已经是最新的了却要求我升级?

    我全新安装了 python 3 7 1 64 位 并使用最新的 pyCharm 作为我的 IDE 我在这台机器上没有安装其他 python 我去安装 numpy 并收到以下消息 venv C Users John PycharmProjec
  • Pygame:有人可以帮我实现双跳吗?

    我知道已经有其他关于此问题的帖子了 但我的运动系统与我发现的有点不同 所以随后我问这个问题 我的运动系统基于一个名为的命名元组Move up left right down 然后就是这个 def update self move block
  • Kivy TextInput 水平和垂直对齐(文本居中)

    如何在 Kivy 的 TextInput 中水平居中文本 I have the following screen But I want to centralize my text like this 这是我的 kv 语言的一部分 BoxLa
  • 如何将 pandas DataFrame 转换为 TimeSeries?

    我正在寻找一种将 DataFrame 转换为 TimeSeries 而不拆分索引和值列的方法 有任何想法吗 谢谢 In 20 import pandas as pd In 21 import numpy as np In 22 dates
  • 如何使用 python 模块的多个 git 分支?

    我想使用 git 来同时处理我正在编写的模块中的多个功能 我目前正在使用 SVN 只有一个工作区 因此我的 PYTHONPATH 上只有该工作区 我意识到这不太理想 所以我想知道是否有人可以建议一种更 正确 的方法来做到这一点 让我用一个假
  • 在自定义 keras 层的调用函数中传递附加参数

    我创建了一个自定义 keras 层 目的是在推理过程中手动更改前一层的激活 以下是基本层 它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
  • 如何仅读取 CSV 文件每行的第一列 [重复]

    这个问题在这里已经有答案了 如何在Python中读取CSV文件每行的第一列 我的数据是这样的 1 abc 2 bcd 3 cde 我只需要循环第一列的值 另外 当我在 calc 中打开 csv 文件时 每行中的数据都在同一个单元格中 这正常
  • 如何在不同的目录中执行python脚本?

    Solved对于可能觉得这有帮助的人 请参阅下面我的答案 我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中 我运行 gt python a py 第一个脚本 a py 在我当前

随机推荐

  • HTML5 视频自动播放在 Chrome 中不起作用

    我正在尝试使用 html5 视频在滑块中显示视频 这适用于controls参数 显示控件 但是当我添加autoplay它不会自动播放 所以我搜索了原因 发现 chome 只允许静音视频自动播放 所以我添加了muted参数 但是当我这样做时
  • Microsoft 应用程序 ID 和密码有何用途?

    我正在尝试部署我的 Azure Bot 服务 但我有点难以理解 Microsoft 应用程序 ID 和密码的用途是什么 有人能给我解释一下这些术语吗 我试图在网上寻找答案但没有成功 感谢您的任何帮助 这是机器人服务的标识 你会注意到在应用程
  • 如何在 Swift 中将“Index”转换为“Int”类型?

    我想将字符串中包含的字母的索引转换为整数值 尝试读取头文件 但找不到类型Index 虽然它看起来符合协议ForwardIndexType使用方法 例如distanceTo var letters abcdefg let index lett
  • 排序/过滤 MVC

    我正在尝试按作者姓氏 出版日期 最新和最旧 标题 最受欢迎和评分最高对搜索结果进行排序 我使用了一个例子 几乎逐字复制 但它对我不起作用 对我做错了什么有什么建议吗 这是我的控制器代码 public ActionResult Index s
  • 如何将 Ncurses 添加到 Visual Studio 2017 中的项目?

    我正在寻找详细的分步指南 以将 Ncurses 添加到 Visual Studio 2017 中的项目中 我下载了源代码 但我不知道如何将其添加到我的项目中 我知道这个问题对你来说很愚蠢 但我是 C 的初学者 没有在网上找到将 Ncurse
  • javax.validation.ValidationException:HV000183:无法加载“javax.el.E​​xpressionFactory”

    我尝试使用休眠验证器编写非常简单的应用程序 我的步骤 在 pom xml 中添加了以下依赖项
  • 如何将 Blue Imp 文件上传集成到 CakePHP?

    Wa正在使用CakePHP 需要集成Blue Imp文件上传库 有人成功整合了这些吗 如果是 您是否设置上传以将文件存储在数据库或文件系统上 您能否分享此类集成的示例 非常感谢您的帮助和指导 是的 我在 php 中集成了 BlueImp 文
  • 如何使用 SQL 从字符串末尾删除数字

    拜托 你能回答我的问题吗 如何使用 SQL 从字符串末尾删除数字 例如 字符串 2Ga4la2009 必须转换为 2Ga4la 问题是我们无法修剪它们 因为我们不知道字符串末尾有多少位数字 最好的问候 加琳娜 这似乎有效 select le
  • 连接到套接字时似乎无法实现超时

    我正在尝试为 connect 提供超时 我四处搜寻 发现了几篇与此相关的文章 我已经编写了我认为应该有效的代码 但不幸的是我没有收到 getsockopt 报告的错误 但是当我执行 write 时 它失败了 错误号为 107 ENOTCON
  • BLOB URL 的自定义名称

    我们有一个 Angular 应用程序 它获取一些输入参数并将它们发送到后端进行处理 处理结果是一个pdf文件 我们要在新选项卡中打开 执行此操作的代码类似于以下内容 myService getDocument document then f
  • 为什么我的 jquery ajax 表单在第一次提交时提交一次,在第二次提交时提交两次......?

    我有一个简单的 AJAX 表单 当我提交它时它可以正常工作 但是 如果我随后将新数据输入到同一表单中 不刷新页面 那么它会提交表单两次 如果我第三次这样做 那么它会提交三次表单 依此类推 它为什么要这样做 这是我的代码 document r
  • OHLC 聚合器不适用于 pandas 上的数据框?

    我不确定这是一个错误还是设计使然 也许我遗漏了一些东西 并且 ohlc 聚合器不应该与数据帧一起工作 也许这种行为是设计使然 因为除了索引列和价格列之外的数据框可能会产生奇怪的结果 其他聚合器 mean stdev 等 使用数据帧 无论如何
  • JSoup - 选择所有评论

    我想使用 JSoup 从文档中选择所有评论 我想做这样的事情 for Element e doc select comment System out println e 我已经尝试过这个 for Element e doc getAllEl
  • Python 脚本无法通过 Cron 运行?

    我有一个运行另一个 python 脚本的 python 脚本 其他脚本 正在运行的脚本 需要大约 45 分钟 才能完成 当 执行 脚本从 Ubuntu 的 shell 运行时 一切都运行良好 我向 cron 添加了一个条目来运行 执行 py
  • rvest:给定多个列表,返回空节点的 NA

    我对 R 相当陌生 特别是使用它进行网页抓取 因此非常感谢任何帮助 我目前正在尝试挖掘一个包含多个门票列表的网页 并列出其中一些门票的附加详细信息 例如视野不佳或仅供儿童使用的门票 我想提取此数据 为不包含这些详细信息的票证列表留下空格或
  • 如何保护 Azure Blob 存储 URL 不被任何使用开发人员工具的人检索

    我必须将图像 视频保存在天蓝色的 blob 中 然后在我的网站中使用它们 经过一些研究后 我发现您必须在 href 标记中包含 blob url 才能从 azure 检索图像 视频 然而 任何人都可以打开该网站页面并获取该 blob url
  • 使用 VBA 从 Excel 工作表发送多个附件

    我有现有的代码可以从 Excel 文件中的工作表发送邮件 Sub CreateMail Dim objOutlook As Object Dim objMail As Object Dim rngTo As Range Dim rngSub
  • python filter() 函数,以 None 作为过滤器参数

    Input list filter None abs 123 sdf Output abs 123 sdf 据我了解None means no value 在 python 中 但在上面的情况下 过滤函数如何删除空字符串 我很困惑None在
  • 基本数组比较算法

    我正在尝试遵循此处找到的步骤比较两个数组 并知道何时创建新对象 但我只是不明白它是如何工作的 您最终会得到两个已排序的数组 其中一个传递了员工 ID 放入获取请求中 并包含匹配的托管对象 他们 要处理它们 您可以在这些之后遍历排序列表 脚步
  • 如何在 python 中取消引用 urlencoded unicode 字符串?

    我有一个像 Tan m 这样的 unicode 字符串 它以某种方式编码为 Tan u0131m 我怎样才能把这个编码字符串转换回原来的unicode 显然 urllib unquote 不支持 unicode uXXXX 是一个非标准编码