在python 2.7中打印阿拉伯/波斯字母[重复]

2024-05-01

在下面的代码中，Python 似乎不支持阿拉伯字母。有任何想法吗？

#!/usr/bin/python
# -*- coding: utf-8 -*-

import nltk
sentence = "ورود ممنوع"

tokens = nltk.word_tokenize(sentence)

print tokens

结果是：

>>> 
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>>

我也尝试添加u在字符串之前，但没有帮助：

>>> u"ورود ممنوع">>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']

您在包含字节字符串的列表中得到了正确的结果：

>>> lst = ['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf',
           '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>> for l in lst:
...  print l
... 
ورود
ممنوع

要将其转换为 unicode，您可以使用列表理解：

>>> lst = [e.decode('utf-8') for e in lst]
>>> lst
[u'\u0648\u0631\u0648\u062f', u'\u0645\u0645\u0646\u0648\u0639']

在列表中打印 Unicode 字符 https://stackoverflow.com/questions/20947173/printing-unicode-char-inside-a-list/20948167#20948167

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

UTF8

NLTK

在python 2.7中打印阿拉伯/波斯字母[重复] 的相关文章

使用 matplotlib 从“列表列表”绘制 3D 曲面

我已经搜索了一些虽然我可以找到许多有用的网格网格示例但没有一个清楚地表明我如何将列表列表中的数据转换为可接受的形式以适应我所讨论的各种方式当谈到 numpy matplotlib 以及我所看到的建议的术语和步骤顺序时我有点迷失我
Python 3 os.urandom

在哪里可以找到完整的教程或文档os urandom 我需要获得一个随机 int 来从 80 个字符的字符串中选择一个字符如果你只需要一个随机整数你可以使用random randint a b 来自随机模块 http docs pytho
Twisted 的 Deferred 和 JavaScript 中的 Promise 一样吗？

我开始在一个需要异步编程的项目中使用 Twisted 并且文档非常好所以我的问题是 Twisted 中的 Deferred 与 Javascript 中的 Promise 相同吗如果不是有什么区别你的问题的答案是Yes and No
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
检查 Python 中的可迭代对象中的所有元素的谓词是否计算为 true

我很确定有一个常见的习语但我无法通过谷歌搜索找到它这是我想做的用Java Applies the predicate to all elements of the iterable and returns true if all ev
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
Django 中所有应用程序的基本模板

我有一个包含 2 个应用程序的项目 project blog templates index html polls templates index html project templates base html index html 现在
.pyx 文件出现未知文件类型错误

我正在尝试构建一个包含 pyx 文件的 Python 包 pyregion 但在构建过程中出现错误检查以下输出 python setup py build running build running build py creating b
使用 python 绘制正值小提琴图

我发现小提琴图信息丰富且有用我使用 python 库 seaborn 然而当应用于正值时它们几乎总是在低端显示负值我发现这确实具有误导性尤其是在处理现实数据集时在seaborn的官方文档中https seaborn pydata
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
使用“默认”环境变量启动新的子进程

我正在编写一个构建脚本来解析依赖的共享库及其共享库等这些共享库在正常情况下是不存在的PATH环境变量为了使构建过程正常工作让编译器找到这些库 PATH已更改为包含这些库的目录构建过程是这样的加载器脚本更改 PATH gt 基于
Anaconda 无法导入 ssl 但 Python 可以

Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
如何根据第一列创建新列，同时考虑Python Pandas中字母和列表的大小？ [复制]

这个问题在这里已经有答案了我在 Python Pandas 中有 DataFrame 如下所示 col1 John Simon prd agc Ann White BeN and Ann bad list Ben Wayne 我需要这样做
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
如何为不同操作系统/Python 版本编译 Python C/C++ 扩展？

我注意到一些成熟的Python库已经为大多数架构 Win32 Win amd64 MacOS 和Python版本提供了预编译版本针对不同环境交叉编译扩展的标准方法是什么葡萄酒虚拟机众包我们使用虚拟机和Hudson http hud

随机推荐

增加 Instagram API 350 个请求限制

根据开发人员文档客户端每小时可以发出 5000 个请求但目前我的应用程序被限制为每小时 350 个请求我收到的错误代码是 400 消息是已超出每小时最大请求数您在过去一小时内发出了 XXX 个请求超过了允许的 350 个请求您
静态资源的 URI 中的上下文路径，我真的需要指定它吗？

我有一个简单的网络应用程序 webapp static images a gif pages test html WEB INF pages test jsp 在test html中有 img src static images a gi
背景重复 x/y 在 Firefox/Safari 中不起作用

我有下面的代码表明background repeat x y由于某些原因它在 FireFox 上不起作用它只是删除了这些样式但并不是说它们是不正确的它们没有在某处被覆盖当我尝试将这些风格结合在一起时 background 它也将其
FORTRAN 写()

在开始之前我必须先声明一下我是 FORTRAN 的新手我正在维护 1978 年的一段遗留代码它的目的是从文件中读取一些数据值处理这些值然后将处理后的值输出到另一个文本文件给出以下 FORTRAN 代码 INTEGER NM S
使用 FocusScope.of(context).unfocus() 重建小部件树

我有这个例子 override Widget build BuildContext context return Scaffold body SafeArea child Padding padding const EdgeInsets a
未找到列：1054 未知列 laravel

所以我尝试用 laravel 制作一个表单但除了新版本之外他们删除了表单但我可以让它运行所以这里是 Route post register function user new User user gt u n Input get u
URL中的gs_upl是什么意思？

在任何谷歌搜索 URL 中 gs upl 是什么意思例如那么 gs upl 1045l1663l0l3648l4l4l0l0l0l0l258l682l0 3 1l4l0 在这里意味着什么从构建的脚本gs upl j 我找到 funct
jquery脉动文本

我正在使用 jquery 来使文本脉动一切都很好但我无法理解某些事情我只想脉动 x 次然后停止我正在使用以下代码来使类产生脉动 document ready function function pulsate pulsate an
何时使用Statement而不是PreparedStatement？

何时使用语句而不是准备好的语句我想在没有参数的查询中使用语句但为什么不使用准备好的语句对于没有参数的查询哪一个更快我想在没有参数的查询中使用语句但为什么不使用准备好的语句那还差得远 PreparedStatements 用于返
aria2c - 有什么办法只保留失败下载的列表吗？

我在用aria2c下载以文本文件形式组织的相当大的 url 列表 6000 基于此gist https gist github com jonbakerfish 0f7877c050b648169e0958ea2e2c6aca 我使用以下脚
为什么 golang 堆配置文件中的“Total MB”小于顶部的“RES”？

我有一个用 go 编写的服务在运行时需要 6 7G 内存 RES 在顶部所以我使用 pprof 工具试图找出问题所在 go tool pprof pdf http
从 DOM 中删除一行后更新 jQuery Tablesorter 插件

我目前有一些代码隐藏已删除的行然后使用 remove 函数将其删除然而我很难让它保持删除状态因为每次我刷新表排序分页器插件或我正在使用的过滤器插件插件时删除的行会重新出现因为它们当然被缓存了目前的代码很简单目前有小部件更
使用 ls 和 grep 列出具有特定扩展名的文件

我只想从当前目录获取文件并且只输出 mp4 mp3 exe 文件没有其他内容所以我想我可以这样做 ls grep mp4 grep mp3 grep exe 但不会因为第一个 grep 将仅输出 mp4 因此其他 2 个 grep
如何更改詹金斯主目录位置？

简单的问题如何更改jenkins主目录位置默认情况下它指向 var lib jenkins 而我希望它指向 mnt home jenkins 我已将 JENKINS HOME 更改为 mnt home jenkins 但这对我没有帮助
防止 .Net MVC WS-Federation 站点中的 XmlHttpRequest 重定向响应

我在 MVC 3 站点上使用 WS 联合声明感知身份验证并且在身份验证失败时无法阻止某些发送 JSON 的 API 控制器返回重定向我有一个名为 API 的区域其中有几个仅返回 JSON 的控制器这些控制器都继承自同一个基类我
使用 SVM 预测概率

我编写了这段代码并想获得分类的概率 from sklearn import svm X 0 0 10 10 20 30 30 30 40 30 80 60 80 50 y 0 1 2 3 4 5 6 clf svm SVC clf prob
在 SVG 中使用变换模拟枢轴旋转

我在 SVG 中有一个矩形需要从特定点绕轴旋转我能想到的最好方法是变换到枢轴的 xy 旋转角度然后再次变换问题是第二个变换的 xy 我认为它会在某种程度上采用 cos 和 sin 只是不确定在哪里或为什么会旋转 90度到也许我以
如何让我的网络爬虫通过C#登录到这个网站

我有一个应用程序可以读取网站上的部分源代码这一切都有效但问题是该页面需要用户登录才能访问该源代码我的程序需要一种方法来最初使用户登录到网站完成后我将能够访问和阅读源代码需要登录的网站是 mmoinn com index do P
如何将导入的命名空间提供给 CompileAssemblyFromSource

我正在尝试将 VB 源文件加载到内存中但是 VB 文件假定与其关联的项目具有在项目级别定义的一些全局导入的命名空间此 VB 功能允许单个文件在每个文件上省略 Imports 语句在 C 中使用 Dim sourceCode As S
在python 2.7中打印阿拉伯/波斯字母[重复]

这个问题在这里已经有答案了在下面的代码中 Python 似乎不支持阿拉伯字母有任何想法吗 usr bin python coding utf 8 import nltk sentence tokens nltk word tokeniz

在python 2.7中打印阿拉伯/波斯字母[重复]

在python 2.7中打印阿拉伯/波斯字母[重复] 的相关文章

随机推荐

热门标签