Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码

2023-12-02

我有一个简单的 Python 脚本，可以从 reddit 中提取帖子并将其发布到 Twitter 上。不幸的是，今晚它开始出现问题，我猜想是因为 Reddit 上某人的标题存在格式问题。我收到的错误是：

  File "redditbot.py", line 82, in <module>
  main()
 File "redditbot.py", line 64, in main
 tweeter(post_dict, post_ids)
 File "redditbot.py", line 74, in tweeter
 print post+" "+post_dict[post]+" #python"
 UnicodeEncodeError: 'ascii' codec can't encode character u'\u201c' in  position 34: ordinal not in range(128)

这是我的脚本：

# encoding=utf8
import praw
import json
import requests
import tweepy
import time
import urllib2
import sys
reload(sys)
sys.setdefaultencoding('utf8')

access_token = 'hidden'
access_token_secret = 'hidden'
consumer_key = 'hidden'
consumer_secret = 'hidden'


def strip_title(title):
    if len(title) < 75:
    return title
else:
    return title[:74] + "..."

def tweet_creator(subreddit_info):
post_dict = {}
post_ids = []
print "[bot] Getting posts from Reddit"
for submission in subreddit_info.get_hot(limit=2000):
    post_dict[strip_title(submission.title)] = submission.url
    post_ids.append(submission.id)
print "[bot] Generating short link using goo.gl"
mini_post_dict = {}
for post in post_dict:
    post_title = post
    post_link = post_dict[post]

    mini_post_dict[post_title] = post_link
return mini_post_dict, post_ids

def setup_connection_reddit(subreddit):
print "[bot] setting up connection with Reddit"
r = praw.Reddit('PythonReddit PyReTw'
            'monitoring %s' %(subreddit))
subreddit = r.get_subreddit('python')
return subreddit



def duplicate_check(id):
found = 0
with open('posted_posts.txt', 'r') as file:
    for line in file:
        if id in line:
            found = 1
return found

def add_id_to_file(id):
with open('posted_posts.txt', 'a') as file:
    file.write(str(id) + "\n")

def main():
subreddit = setup_connection_reddit('python')
post_dict, post_ids = tweet_creator(subreddit)
tweeter(post_dict, post_ids)

def tweeter(post_dict, post_ids):
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
for post, post_id in zip(post_dict, post_ids):
    found = duplicate_check(post_id)
    if found == 0:
        print "[bot] Posting this link on twitter"
        print post+" "+post_dict[post]+" #python"
        api.update_status(post+" "+post_dict[post]+" #python")
        add_id_to_file(post_id)
        time.sleep(3000)
    else:
        print "[bot] Already posted"

if __name__ == '__main__':
main()

任何帮助将非常感激 - 提前致谢！

考虑这个简单的程序：

print(u'\u201c' + "python")

如果您尝试打印到终端（使用适当的字符编码），您会得到

“python

但是，如果您尝试将输出重定向到文件，您会得到一个UnicodeEncodeError.

script.py > /tmp/out
Traceback (most recent call last):
  File "/home/unutbu/pybin/script.py", line 4, in <module>
    print(u'\u201c' + "python")
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201c' in position 0: ordinal not in range(128)

当您打印到终端时，Python 使用终端的字符编码来编码 unicode。（终端只能打印字节，因此必须对 unicode 进行编码才能打印。）

当您将输出重定向到文件时，Python 无法确定字符编码，因为文件没有声明编码。所以默认情况下Python2使用以下方式隐式编码所有unicodeascii写入文件之前进行编码。自从u'\u201c'无法进行ascii编码，aUnicodeEncodeError。（只有前 127 个 unicode 代码点可以用 ascii 进行编码）。

这个问题在为什么打印失败 wiki.

要解决此问题，首先，避免添加 unicode 和字节字符串。这会导致在Python2中使用ascii编解码器进行隐式转换，并在Python3中引发异常。为了让你的代码面向未来，最好是明确的。例如，编码post在格式化和打印字节之前明确：

post = post.encode('utf-8')
print('{} {} #python'.format(post, post_dict[post]))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码的相关文章

在Python中，如何将矩阵逆时针旋转90度？

gt gt gt def rotate matrix k List List int For example if I have m 1 2 3 2 3 3 5 4 3 rotate matrix m should give me 3 3
在 Android 中使用 DataOutputStream 在 POST 正文中发送特殊字符 (ë ä ï)

我目前正在开发一个具有大量服务器端通信的 Android 应用程序昨天我收到一份错误报告称用户无法发送简单特殊字符例如我搜索过但没有找到任何有用的东西可能重复没有答案 https stackoverflow com que
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
通过 python 中的另外两个修改数组[重复]

这个问题在这里已经有答案了假设我们有三个一维数组 A 长度为 5 B 长度相同示例中为5 C 更长比如长度为 100 C最初用零填充 A给出索引C应更改的元素它们可能会重复以及B给出应添加到初始零的值C 例如如果A 1 3 3
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
django 模板 - 如何动态访问变量？

假设我有一个具有以下上下文的 django 模板 data1 this is data1 data2 this is data2 data name data2 现在我知道了data name 假设它是 data2 是否可以用它来访问变量d
Django 多对多关系（类别）

我的目标是向我的 Post 模型添加类别我希望以后能够按不同类别有时是多个类别查询所有帖子模型 py class Category models Model categories 1 red 2 blue 3 black title
发送 POST 请求时 JSON 原语无效

我有以下 ajax 请求其中我尝试将 JSON 对象发送到服务器 function sendData subscriptionJson ajax type POST url Url Action SubscribeSecurities S
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

我正在尝试通过电子邮件激活用户电子邮件有效编码有效我使用了 django1 11 中的方法该方法运行成功在 Django 1 11 中以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
Jackson 将单个项目反序列化到列表中

我正在尝试使用一项服务该服务为我提供了一个带有数组字段的实体 id 23233 items name item 1 name item 2 但是当数组包含单个项目时将返回该项目本身而不是包含一个元素的数组 id 43567 item

随机推荐

ASP.Net 2012 使用 jQuery 进行非侵入式验证

我正在使用 Visual Studio 2012 我创建了一个空 ASP Net Web 应用程序当我尝试添加传统验证器控件到新页面出现这个错误 WebForms UnobtrusiveValidationMode 需要 jquery
oracle sql在计数时不是按表达式分组[重复]

这个问题在这里已经有答案了我正在尝试运行以下查询来计算过去 6 个月内转诊患者的医生数量 SELECT count local doc providerno NumberofReferals LOCAL DOC FULLNAME FULL
Javascript 世界时区与 GMT 的时差计算器

我希望有人能告诉我定期更新时区数据库的方向我找到了一个但抱歉我不记得它来自哪里但是随着当前 GMT 时钟变化的快速临近我担心我的所有数据都会不正确即从英国到纽约的时差将从落后 5 小时变为 6 小时落后几个小时任何有关此事的帮助
包含相当于 SQL Server 中的 Like

当我运行此查询时 Select from Table1 Where Column1 Like aaa 3 Result Select from Table1 Where Column1 Like a 3 Result Select from
PowerShell 的 ConvertFrom-SecureString -key 的安全性如何

我有一个模块其中包含一些带有一些私有数据的字符串这些数据应该很难获得但会经常更改我需要将此脚本放在各种机器上这些机器可能会访问它并且代码可能会被不应该拥有用于导出输出的信息的人读取我真的很担心不时变化的字符串因此我正在考虑创
PyOpenGL 如何导入 obj 文件？

import pygame import OpenGL from pygame locals import from OpenGL GL import from OpenGL GLU import import pywavefront sc
javascript highchart 照片幻灯片

我正在使用 javascript 库 highchart 创建可视化图表我用一些虚假数据创建了图表我想知道如何使用图表数据触发图像幻灯片因此如果我将鼠标悬停在图表中某个点的数据上相应的图像将水平滑动到页面中心这是到目前为止我的一
如何计算负数的平方根？

我正在尝试使用以下代码从负数的平方根创建复数 include Math z Complex sqrt 9 但它会产生这个错误 Math DomainError Numerical argument is out of domain sqrt
在 NetworkX 中重现相同的图

我想改进我的图表存在以下问题如何创建一致的图图本身并不一致每次我执行运行代码时它都会生成不同的图像不一致的图表显示在 url 中如何自定义整个图表图片的大小并使其更大如何为对象 a 设置永久位置以便它始终出现在第一个
为登录 Facebook 的 Android 应用程序编写测试

我的 Android 应用程序使用FacebookSDK用于登录这是第一个屏幕除非登录否则您无法执行任何操作我想写一些Espresso在 Greenhouse 持续集成服务器上运行的测试我搜索了一下发现 iOS 上有 FBSDK
如何在 MVC 中创建通用视图模型？

我想在 MVC 中使用视图模型而不是使用 viewbag 有没有一种方法可以创建一些在所有控制器之间共享的通用视图模型然后在我的视图中使用它为此我需要什么样的代码我想也许在基本控制器中创建一些东西那可能吗我相信在控制器和视图之间传
复制失败：stat /var/lib/docker/tmp/docker-builder076499369/files/nginx.conf：没有这样的文件或目录

我正在运行以下版本的 docker ce Server Docker Engine Community Engine Version 18 09 5 API version 1 39 minimum version 1 12 Go vers
r devtools test() 错误，但测试 test_file() 是否有效

我正在构建的包中有一个函数它将十六进制代码分配给全局环境以供分析师使用 optiplum lt function assign x optiplum value rgb red 129 green 61 blue 114 maxColor
按值传递 typedef（固定大小）数组

我很难理解typedef数组的模式 typedef char Char10 10 void fun Char10 a not passing reference interested in pass by value if typeid C
如何在bash中从html中提取td？

我正在从 geonames 查询伦敦邮政编码数据我想将输出转换为仅包含邮政编码标识符 Bethnal Green Islington 等的列表在 bash 中仅提取名称的最佳方法是什么我不确定你是不是这个意思 n分隔列表或用括号括
如何获得闪烁的按钮？（两张交替的图片）

我想要一个闪烁的按钮实际上我的按钮看起来像这样 redButton setImage UIImage imageNamed Button1 png forState UIControlStateNormal redButton setIm
C - 对非 2 的幂的数字进行按位运算的算法

我知道 2 的幂的模可以使用按位运算符计算 x 2 n x 2 n 1 但我想知道是否存在任何通用的按位算法来查找任何数字的模不是 2 的幂例如 7 5 先感谢您有几个用于特殊情况包括 5 个由于 16 1 mod 5 您可以做的
如何使用简单的查询将 JSON 文件导入 MySQL 数据库，而不实际将其转换为任何其他文件格式（如 CSV 等）？

我尝试导入一个 JSON 文件如下所示 executionDateTime 2017 07 07 15 21 15 A 1 B 1 executionDateTime 2017 07 07 15 21 15 A 2 B 2 executi
加速 Android Studio 构建

也许是一个已知问题但正在寻找加速 Android Studio 构建的方法我的大约是 20 25 秒并不可怕但在尝试测试增量更改时有点麻烦显然获得更快的 CPU 会有所帮助但如果有的话请寻找 Android Studio 的
Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码

我有一个简单的 Python 脚本可以从 reddit 中提取帖子并将其发布到 Twitter 上不幸的是今晚它开始出现问题我猜想是因为 Reddit 上某人的标题存在格式问题我收到的错误是 File redditbot py l

Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码

Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码 的相关文章

随机推荐

热门标签

Python 脚本收到 UnicodeEncodeError：“ascii”编解码器无法对字符进行编码的相关文章