由于 unicode 导致 u 导致 Doctest 失败

2023-12-08

我正在为一个输出标记化单词列表的函数编写文档测试。

r'''

>>> s = "This is a tokenized sentence s\u00f3"
>>> tokenizer.tokenize(s0)
['This', 'is', 'a', 'tokenized', 'sentence', 'só']

'''

Using Python3.4我的测试顺利通过。

Using Python2.7 I get:

Expected:
  ['This', 'is', 'a', 'tokenized', 'sentence', 'só']
Got:
  [u'This', u'is', u'a', u'tokenized', u'sentence', u's\xf3']

我的代码必须在 Python3.4 和 Python2.7 上运行。我怎么解决这个问题？

Python 3 对 Unicode 对象使用不同的字符串文字。没有u前缀（在规范表示中）和一些非 ascii 字符按字面显示，例如，'só'是 Python 3 中的 Unicode 字符串（如果您在输出中看到它，则它是 Python 2 中的字节串）。

如果您感兴趣的是该函数如何将输入文本拆分为标记；您可以在单独的行上打印每个标记，以使结果与 Python 2/3 兼容：

print("\n".join(tokenizer.tokenize(s0)))
This
is
a
tokenized
sentence
só

作为替代方案，您可以定制doctest.OutputChecker，例子：

#!/usr/bin/env python
r"""
>>> u"This is a tokenized sentence s\u00f3".split()
[u'This', u'is', u'a', u'tokenized', u'sentence', u's\xf3']
"""
import doctest
import re
import sys

class Py23DocChecker(doctest.OutputChecker):
    def check_output(self, want, got, optionflags):
        if sys.version_info[0] > 2:
            want = re.sub("u'(.*?)'", "'\\1'", want)
            want = re.sub('u"(.*?)"', '"\\1"', want)
        return doctest.OutputChecker.check_output(self, want, got, optionflags)

if __name__ == "__main__":
    import unittest

    suite = doctest.DocTestSuite(sys.modules['__main__'], checker=Py23DocChecker())
    sys.exit(len(unittest.TextTestRunner().run(suite).failures))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

portability

doctest

由于 unicode 导致 u 导致 Doctest 失败的相关文章

在 Python 中使用 XPath 和 LXML

我有一个 python 脚本用于解析 XML 并将某些感兴趣的元素导出到 csv 文件中我现在尝试更改脚本以允许根据条件过滤 XML 文件等效的 XPath 查询将是 DC Events Confirmation contains T
NLTK、搭配问题：需要解包的值太多（预期为 2）

我尝试使用 NLTK 检索搭配但出现错误我使用内置的古腾堡语料库 I wrote alice nltk corpus gutenberg fileids 7 al nltk corpus gutenberg words alice al
Sorted(key=lambda: ...) 背后的语法[重复]

这个问题在这里已经有答案了我不太明白背后的语法sorted 争论 key lambda variable variable 0 Isn t lambda随意的为什么是variable在看起来像的内容中陈述了两次dict 我认为这里的所有
如何在 Windows 上使用 Python 3.6 来安装 Python 2.7

我想问一下如何使用pip install对于 Python 2 7 当我之前安装并使用 Python 3 6 时我现在必须使用 Windows 上的 Python 版本 pip install 继续安装 Python 3 6 我需要使用以
行为：如何从另一个文件导入步骤？

我刚刚开始使用behave http pythonhosted org behave 一个Pythonic BDD框架使用小黄瓜语法 http docs behat org guides 1 gherkin html 行为需要一个特征例
Python 中的这种赋值方式叫什么？ a = b = 真

我知道关于元组拆包 http docs python org tutorial datastructures html tuples and sequences但是当一行中有多个等号时这个赋值被称为什么阿拉a b True 它总是让我有
Python unicode 字符代码？

有没有办法将 Unicode 字符插入 Python 3 中的字符串例如 gt gt gt import unicode gt gt gt string This is a full block s unicode charcode U
使用循环将对象添加到列表（python）

我正在尝试使用 while 循环将对象添加到列表中基本上这就是我想做的 class x pass choice raw input pick what you want to do while choice 0 if choice 1 E
在 Windows 上使用 IPython 笔记本时出现 500 服务器错误

我刚刚在 Windows 7 Professional 64 位上全新安装了 IPython 笔记本我采取的步骤是从以下位置安装 Python 3 4 1http python org http python org gt pip in
是否可以写一个负的python类型注释

这可能听起来不合理但现在我需要否定类型注释我的意思是这样的 an int Not Iterable a string Iterable 这是因为我为一个函数编写了一个重载而 mypy 不理解我我的功能看起来像这样 overload
使用 Doc2vec 后如何解释 Clusters 结果？

我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式例如 v1 v100 之后我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
asyncio - 多次等待协程（周期性任务）

我正在尝试为异步事件循环创建定期任务如下所示但是我收到 RuntimeError 无法重用已等待的协程异常显然 asyncio 不允许等待相同的可等待函数如中讨论的这个错误线程 https bugs python org issu
CSV 在列中查找最大值并附加新数据

大约两个小时前我问了一个关于从网站读取和写入数据的问题从那时起我花了最后两个小时试图找到一种方法来从输出的 A 列读取最大日期值将该值与刷新的网站数据进行比较并将任何新数据附加到 csv 文件而不覆盖旧的或创建重复项目前 100
Pandas 在特定列将数据帧拆分为两个数据帧

I have pandas我组成的 DataFrameconcat 一行由 96 个值组成我想将 DataFrame 从值 72 中分离出来这样一行的前 72 个值存储在 Dataframe1 中接下来的 24 个值存储在 Data
从 dask 数据框中的日期时间序列获取年份和星期？

如果我有一个 Pandas 数据框和一个日期时间类型的列我可以按如下方式获取年份 df year df date dt year 对于 dask 数据框这是行不通的如果我先计算像这样 df year df date compute
将 Scikit-Learn OneHotEncoder 与 Pandas DataFrame 结合使用

我正在尝试使用 Scikit Learn 的 OneHotEncoder 将 Pandas DataFrame 中包含字符串的列替换为 one hot 编码的等效项我的下面的代码不起作用 from sklearn preprocessin
具有指定置信区间的 Seaborn 条形图

我想在 Seaborn 条形图上绘制置信区间但我已经计算出置信区间如何让 Seaborn 绘制我的置信区间而不是尝试自行计算它们例如假设我有以下 pandas DataFrame x pd DataFrame Group 1 0 5
使用“pythonw”（而不是“python”）运行应用程序时找不到模块

我尝试了这个最小的例子 from flask import Flask app Flask name app route def hello world return Hello World if name main app run deb
如何识别图形线条

我有以下格式的路径的 x y 数据示例仅用于说明 seq p1 p2 0 20 2 3 1 20 2 4 2 20 4 4 3 22 5 5 4 22 5 6 5 23 6 2 6 23 6 3 7 23 6 4 每条路径都有多个点它们
使用 numpy 加速 for 循环

下一个 for 循环如何使用 numpy 获得加速我想这里可以使用一些奇特的索引技巧但我不知道是哪一个这里可以使用 einsum 吗 a 0 for i in range len b a numpy mean C d e f b i

随机推荐

从 IP 摄像头流式传输 C#

我有以下代码不起作用我的camUrl如果我加载到 Firefox 并从我的摄像头进行流传输则链接有效但在运行时我的图片框中没有显示任何内容有什么想法吗 public Thread camThread private string c
Jasper：从 url 打开输入流时出错

我正在使用 iReport 设计一个 jasper 报告它接受一个参数并从给定的 URL 获取图像参数是用户在 Twitter 中的屏幕名称 url 是其个人资料图片
使用“--to script”忽略“jupyter nbconvert”中的降价单元

是否可以有jupyter nbconvert to script忽略 Markdown 单元格而不是将其转换为注释我问是因为我想使用flake8检查生成的 Python 代码但我不想包含 markdown 单元格例如因为它们通常很长
如何更改访问的CSS中的字体大小？ [复制]

这个问题在这里已经有答案了在我的应用程序中我需要更改所访问链接的字体大小我正在做的是 a visited color pink font size 12px 但只有颜色发生了变化为什么字体大小没有改变的局限性 visited Th
如何使用Polymer Fire将数据插入Firebase（多节点+多路径）

我的用例是我有一个
Python调用脚本而不等待它执行

我想知道是否有任何方法可以调用 python 脚本并在不同的线程中完全启动该程序以便主程序调用者不必等到被调用的脚本完成执行到目前为止我已经尝试了 subprocess 和 os system 但这两个都会延迟直到脚本完成执行
使用 Matplotlib 绘制半对数图中的纵横比

当我在 matplotlib 中绘制函数时绘图由矩形框住我希望这个矩形的长度和高度的比率由黄金分割给出即 dx dy 1 618033 如果 x 和 y 比例是线性的我使用谷歌找到了这个解决方案 import numpy as np
嵌入 html 的 php 代码在 iis 上托管时不执行

当我在浏览器中运行上面的代码时 firefox 会像这样呈现它 Hello World gt 我正在 Windows XP IIS 5 1 中进行编码我已正确设置 PHP 因为运行 php 文件没有问题在我看来问题在于 IIS 无法呈
在装有 VS2012 但没有 VS2010 的干净计算机上，具有多个角色实例的 Windows Azure 计算模拟器 (SDK 1.8) 的奇怪行为

您是否曾经尝试过在具有完整 IIS 和多个角色实例的 Windows Azure 模拟器中运行托管服务几天前我注意到 IIS 中一次只有一个 Web 角色的多个实例启动以下屏幕截图说明了该行为屏幕截图前面的消息框显示了此行为的原因
我应该始终使用最新的 javac 编译器来编译 Java 代码吗？

我即将把tomcat安装从6 0版本升级到8 5版本并将JVM从6升级到8 我们的java代码目前是用java 6编译的我知道在最新的 JVM 上运行 java 代码在性能方面始终是一个好主意更不用说在安全方面这样与 JVM 6
如何添加到 node.js 中现有的 json 文件

我是 Node js 和 JavaScript 的新手我有一个results json我想保存一个从网络上提取图像的脚本结果的运行日志但是我当前的脚本仅覆盖现有结果我如何构建或添加到results json那么每个后续结果都会记录在
ios，alamofire5：需要相当于curl --key foo.key --cert foo，pem --location --request GET 'https://bar.baz/foo"

除了用于 pin 证书的公钥之外我还有一个私钥如何向服务器进行身份验证 file foo der data foo private der data 使用 openssl 派生自 foo key PEM RSA private key
是否可以通过蓝牙从 PC 向 Android 设备发送/接收语音

我有一台PC 运行java程序蓝牙适配器支持A2DP 和Android设备 2 3 6 也支持A2DP 我想要通过蓝牙将实时语音数据从 PC 麦克风发送到 Android 设备通过蓝牙将实时语音数据从 Android 设备的麦克风发
在全屏模式下隐藏标题？

有没有办法隐藏窗口标题使其不会以全屏模式显示 getWindow setFlags LayoutParams FLAG FULLSCREEN LayoutParams FLAG FULLSCREEN 但随后会出现 getWindow cl
使用 JavaMail 从 GMail 读取完整电子邮件

我正在使用 javamail 但无法从 gmail 电子邮件中获取 HTML 我有以下内容 Session session Session getDefaultInstance props null Store store session
Java泛型，无界通配符

Hi 直接来自Oracle提供的java教程http docs oracle com javase tutorial collections interfaces collection html static void filter Col
PHP类成员可见性和继承性详解

考虑以下片段 Class A private a foo public function F return this gt a Class B extends A private a bar echo new B gt F 结果是foo 好
我正在使用 GCP 服务帐户，但在调用 Dialog Flow API 时出现错误

这是错误您的应用程序已使用来自的最终用户凭据进行了身份验证不支持的 Google Cloud SDK 或 Google Cloud Shell dialogflow googleapis com 我们建议大多数服务器应用程序请改用服务
Ant 中属性文件中的变量

我有一个 Android 应用程序需要针对不同的环境例如 UAT 登台生产等构建每个环境需要不同的属性例如 URL 包等我想将所有不同的参数放入一个属性文件中并为每个参数添加与其匹配的环境前缀例如属性文件将包含dev h
由于 unicode 导致 u 导致 Doctest 失败

我正在为一个输出标记化单词列表的函数编写文档测试 r gt gt gt s This is a tokenized sentence s u00f3 gt gt gt tokenizer tokenize s0 This is a toke

由于 unicode 导致 u 导致 Doctest 失败

由于 unicode 导致 u 导致 Doctest 失败 的相关文章

随机推荐

热门标签

由于 unicode 导致 u 导致 Doctest 失败的相关文章