我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？

2024-02-07

在分析我们的代码时，我惊讶地发现数百万次调用
C:\Python26\lib\encodings\utf_8.py:15（解码）

我开始调试，发现我们的代码库中存在许多小错误，通常是将字符串与 unicode 进行比较，或者添加字符串和 unicode。 Python 会优雅地解码字符串并以 unicode 执行以下操作。

多么体贴。但很贵！

我对 unicode 很流利，读过乔尔·斯波尔斯基 http://www.joelonsoftware.com/articles/Unicode.html and 深入Python http://xshi.org/web-1.0/notes/diveintopython-5.4/html/xml_processing/unicode.html...

我尝试将我们的代码内部仅保留为 unicode。

我的问题 - 我可以关闭这种Python式的好人行为吗？至少在我找到所有这些错误并修复它们之前（通常通过添加 u'u'）？

其中一些非常难以找到（有时是字符串的变量......）。

Python 2.6.5（我无法切换到3.x）。

以下应该有效：

>>> import sys
>>> reload(sys)
<module 'sys' (built-in)>
>>> sys.setdefaultencoding('undefined')
>>> u"abc" + u"xyz"
u'abcxyz'
>>> u"abc" + "xyz"
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/encodings/undefined.py", line 22, in decode
    raise UnicodeError("undefined encoding")
UnicodeError: undefined encoding

reload(sys)上面的代码片段中只需要在这里，因为通常sys.setdefaultencoding应该去sitecustomize.pyPython 中的文件site-packages目录（建议这样做）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

debugging

Unicode

Decoding

我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？的相关文章

将 c++ 异常传播到 cython - python 异常

我的 Cython 0 17 1 有问题我的函数抛出一个std runtime error如果文件不存在我想以某种方式将此异常传播到我的 Cython 代码 void loadFile const string filename som
反转 Python 整数的位

给定一个十进制整数例如 65 如何反转 Python 中的底层位即以下操作 65 01000001 10000010 130 看来这个任务可以分为三步将十进制整数转换为二进制表示形式反转位转换回十进制第 2 步和第 3 步看起来
对 numpy 数组的每 n 个元素求平均值

我有一个 numpy 数组我想创建一个新数组它是每个连续三元组元素的平均值因此新数组的大小将是原始数组的三分之一举个例子 np array 1 2 3 1 2 3 1 2 3 应该返回数组 np array 2 2 2 谁能建议一
在 opencv 中一次性将旋转和平移结合起来

我有一段用于旋转和平移图像的代码 Point2f pt 0 in rows double angle atan trans c trans b 180 M PI Mat r getRotationMatrix2D pt angle 1 0
xlwt 可以在单元格中创建一个包含标题和链接变量的超链接吗？

例如如何更改以下行使 test 为变量 T 且 http google com http google com 是变量L ws write 0 0 xlwt Formula test HYPERLINK http google com
组内条件计数

我想在之后进行条件计数groupby 例如按列的值分组A 然后计算每组中值出现的频率5出现在列中B 如果我整个过程都这样做DataFrame 只是len df df B 5 所以我希望我能做到df groupby A df B 5 siz
Python 中 Matlab 'fscanf' 的等价物是什么？

Matlab函数fscanf 似乎很强大 python 或numpy 中是否有相同的等效项具体来说我想从文件中读取矩阵但我不想迭代每一行来读取矩阵类似的东西来自 matlab 用于读取 2D 1000x1000 矩阵 matrix
谷歌colab录音，如何实现更精确的方式告诉用户开始对着麦克风说话

我正在尝试创建一个为机器学习项目录制音频的程序我想使用 google colab 这样人们就不必在他们的系统上安装或运行任何东西我在网上找到了这个录制和播放音频的示例单元格 1 包含用于录制音频的 js 代码和用于将其转换为字节对象的
在未运行 python 中的函数的情况下检查了非本地语句[重复]

这个问题在这里已经有答案了以前我认为当我们定义一个函数时该函数可能是错误的但python在执行之前不会检查它 x 100 def f x 1 0 return x print x gt gt gt 100 然而当我学习的时候nonl
禁用或限制 /o/applications（django rest 框架、oauth2）

我目前正在使用 Django Rest 框架编写 REST API 并使用 oauth2 进行身份验证使用 django oauth toolkit 我对他们俩都很满意他们做的正是我想要的然而我有一个担忧我正在将我的应用程序传递到
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
使用缓存时计算“页面浏览量”或“点击量”

我有一个叫做show board 在其中除其他外我增加了一个字段Board views每次运行时加 1 以计算页面浏览量问题是当我在该视图上使用 cache page 装饰器时 Board views仅在每次生成新的缓存视图时才会增加
将连续行与相同的列值合并

我有一个看起来像这样的东西我该如何处理 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 4 based VBN 5 in IN 6 Silicon LOCATIO
Code::Blocks 中的调试似乎不起作用 - 缺少调试符号

我正在尝试在 Code Blocks 中调试程序我跟着本指南 http wiki codeblocks org index php title Debugging with Code Blocks and 这个短视频 http www y
如果出现重复，则主键取正值

我有一个数据框df Key1 Key2 Value K11 K21 V1 K11 K21 V1 K13 K23 V2 K13 K23 V2 现在例如对于相同的键 K11 K21 组合我们有 2 个值一负一正如何从此 df 中仅获取正
具有默认参数的Python类构造函数[重复]

这个问题在这里已经有答案了可能的重复 Python 中的最不令人惊讶可变默认参数 https stackoverflow com questions 1132941 least astonishment in python the m
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
对象对于所需数组来说太深 - scipy.integrate.odeint

我昨天刚开始使用Python 使用时遇到错误scipy integrate odeint 我定义了一个函数 def SIR x t beta gamma mu M 这需要numpy array物体x t and M 标量浮动beta gam
与仅调用依赖函数/类相比，在 FastAPI 中使用 Depends 有哪些优点？

FastAPI 提供了way https fastapi tiangolo com tutorial dependencies 通过其自己的依赖关系解析机制来管理依赖关系例如数据库连接它类似于一个pytest夹具系统简而言之您在函数

随机推荐

返回“this”作为右值

正如预期的那样以下代码无法编译 include
使用网络组件创建带有标记的谷歌地图

我正在尝试使用聚合物和网络组件在谷歌地图中显示一些标记这是我的代码
MSBuild SignFile 任务返回 MSB3481：找不到签名证书

我最近获得了新的代码签名证书我正在使用 MSBuild 的 SignFile 任务来签署应用程序清单由于某种原因任务正在返回 MSB3481 The signing certificate could not be located E
在实体框架 LINQ 查询中使用 IEnumerable.Contains 时如何避免查询计划重新编译？

我使用实体框架 v6 1 1 执行以下 LINQ 查询 private IList
在 Go 中使用反射来获取结构体的名称

我发现这个问题有很好的答案如何在 Golang 中查找对象的类型 https stackoverflow com questions 20170275 how to find a type of a object in golang 我尝
如何在pytorch中返回中间梯度（对于非叶节点）？

我的问题是关于 pytorch 的语法register hook x torch tensor 1 requires grad True y x 2 z 2 y x register hook print y register hook p
扫描 IP 地址范围的正确方法

给定用户输入的 IP 地址范围通过各种方式我想确定其中哪些计算机正在运行我可以与之通信的软件这是基本过程 Ping 这些地址以查找可用的机器连接到可用机器上的已知套接字向成功建立的套接字发送消息将响应与预期响应进行比较步骤 2
最小纯应用解析器

我试图找出如何基于一个简单的构建纯应用解析器 parser http dev stephendiehl com fun 002 parsers html执行解析器在其实现中不会使用 monad 我之前问过这个问题但错误地回答了这个问题
activemq-all“5.15.3”不适用于 Spring 5

我正在将 Spring 从 4 x x 更新到 Spring 5 0 3 该项目使用ActiveMQ版本5 15 3 当我尝试使用最新版本的 Spring 部署应用程序时出现以下错误 Caused by java lang NoSuchM
更改 Android Studio 中默认的快速文档/文档悬停大小

一段时间以来我在使用 Android Studio 时遇到了一个问题我的快速文档悬停被最小化如下所示 It would be much nicer if by default it was a larger size e g 有谁知道
C# 日期时间格式更改

我想转换 datetime now 格式日月年时分秒上午下午为美国时间格式即月日年时分秒上午下午此外我希望转换后的格式为日期时间而不是字符串因为它存储在数据库中并且数据库中的字段采用日期时间格式
waitForSelector 找不到相关部分

我使用以下代码与 Puppeteer 来检查相关部分是否已加载但它总是返回加载错误这可能是什么原因缺少哪一部分我不明白我正在使用下面的代码 async function getResults lnk const results co
aleagpu 引发的 TypeInitializationException

我正在尝试使用 aleagpu 但出现 System TypeInitializationException 我尝试用谷歌搜索问题所在但找不到任何解决方案所以请帮忙该程序是最简单的 class Klazz private const
如何在nx服务之前执行nx构建？

好奇执行的正确方法是什么nx build命令作为先决条件nx serve 例如在我的workspace json 的示例中 foo root apps foo sourceRoot apps foo src projectType app
Facebook iOS 应用内浏览器中的音频标签

我有一个带有音频标签的网页它在移动 Safari 中运行良好但是当我从 iOS 上的 Facebook 应用程序打开链接时它会在应用程序内浏览器中打开此处音频拒绝播放如果显示控件但没有音频它将表明它正在播放视频似乎工作正常
nodeJS v19 放弃了对 --es-module-specifier-resolution=node 的支持，这使得运行转译的 TypeScript 变得更加困难 [重复]

这个问题在这里已经有答案了 Typescript 被转换为 JavaScript 因此是一个模块routes ts被转换成routes js在目录中tsc说如果另一个模块从模块导入名称例如路由器我们会省略后缀如下所示 import
为什么“None is None is None”返回 True？ [复制]

这个问题在这里已经有答案了今天在一次采访中 CTO 问了我一个看起来很简单的问题这个语句返回什么 None is None is None 我以为Python执行了第一个操作None is None并会返回True 之后就会比较Tru
iOS 11 中的 UIRefreshControl() 故障效果

每次我拉动刷新 TableView 时 UIRefreshControl 都会出现故障下面是我正在使用的代码有任何想法吗在应用程序委托中 UINavigationBar appearance isTranslucent false U
Swift flatMap 在与可选数组一起使用时给出意外的结果

我们有一个 Person 对象数组每个对象都有另一个 String 数组这是可选的我们想要我们社会中的汽车名称的综合列表 struct Person let name String let address String let age
我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？

在分析我们的代码时我惊讶地发现数百万次调用C Python26 lib encodings utf 8 py 15 解码我开始调试发现我们的代码库中存在许多小错误通常是将字符串与 unicode 进行比较或者添加字符串和 unic

我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？

我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？ 的相关文章

随机推荐

热门标签

我可以关闭隐式 Python unicode 转换来查找混合字符串错误吗？的相关文章