Python 加载 UTF-8 JSON

2024-01-19

我有以下 JSON（为简单起见，我只使用一个，但实际上有 100 个条目）：

{
    "Active": false, 
    "Book": "US Derivat. London, Mike Übersax/Michael Jealous", 
    "ExpirationDate": "2006-10-12", 
    "Isin": "CH0013096497", 
    "IssueDate": "2001-10-09", 
    "KbForXMonths": "0", 
    "KbPeriodDay": "Period", 
    "KbType": "Prozent", 
    "KbYear": "0.5", 
    "Keyinvest_IssueRetro": "0.50%", 
    "Keyinvest_RecurringRetro": "1.00% pro rata temporis", 
    "Keyinvest_RetroPayment": "Every month", 
    "LastImportDate": "2008-12-31", 
    "LiberierungDate": "1900-01-01", 
    "NominalCcy": "USD", 
    "NominalStueck": "5,000", 
    "PrimaryCCR": "0", 
    "QuoteType": "Nominal", 
    "RealValor": "0", 
    "Remarks": "", 
    "RwbeProductId_CCR": "034900", 
    "RwbeProductId_EFS": "034900", 
    "SecName": "Cliquet GROI on Nasdaq", 
    "SecType": "EQ", 
    "SubscriptionEndDate": "1900-01-01", 
    "TerminationDate": "2003-10-19", 
    "TradingCcy": "USD", 
    "Valor": 1309649
}

我正在尝试读取此 JSON 以便将其另存为 .csv（以便我可以将其导入数据库）

但是，当我尝试将此 JSON 数据写入 csv 时，如下所示：

with codecs.open('EFSDUMP.csv', 'w', 'utf-8-sig') as csv_file:
    content_writer = csv.writer(csv_file, delimiter=',')
    content_writer.writerow(data.values())

我收到错误：

UnicodeEncodeError: 'ascii' codec can't encode character u'\xdc' in position 25: ordinal not in range(128)

这是因为 JSON 中有一个变音符号（请参阅属性“Book”）。

我尝试像这样读取 JSON：

data = json.loads(open('EFSDUMP.json').read().decode('utf-8-sig'))

有趣的是：

print data

给了我这个：

{u'PrimaryCCR': u'0', u'SecType': u'EQ', u'Valor': 1309649, u'KbType': u'Prozent', u'Book': u'US Derivat. London, Mike \xdcbersax/Michael Jealous', u'Keyinvest_RecurringRetro': u'1.00% pro rata temporis', u'TerminationDate': u'2003-10-19', u'RwbeProductId_CCR': u'034900', u'SubscriptionEndDate': u'1900-01-01', u'ExpirationDate': u'2006-10-12', u'Keyinvest_RetroPayment': u'Every month', u'Keyinvest_IssueRetro': u'0.50%', u'QuoteType': u'Nominal', u'KbYear': u'0.5', u'LastImportDate': u'2008-12-31', u'Remarks': u'', u'RealValor': u'0', u'SecName': u'Cliquet GROI on Nasdaq', u'Active': False, u'KbPeriodDay': u'Period', u'Isin': u'CH0013096497', u'LiberierungDate': u'1900-01-01', u'IssueDate': u'2001-10-09', u'KbForXMonths': u'0', u'NominalCcy': u'USD', u'RwbeProductId_EFS': u'034900', u'TradingCcy': u'USD', u'NominalStueck': u'5,000'}

显然元音变音变成了“\xdc”

但是当我这样做时：

print data['Book']

这意味着我直接访问该属性，我得到：

US Derivat. London, Mike Übersax/Michael Jealous

所以变音符号又是一个真正的变音符号。

我很确定 JSON 是没有 BOM 的 UTF-8 （Notepad++ 是这样声明的）

我已经尝试过这里的所有建议，但没有成功：Python加载带有UTF-8 BOM头的json文件 https://stackoverflow.com/questions/13156395/python-load-json-file-with-utf-8-bom-header

如何正确读取 UTF-8 JSON 文件以便能够将其写入 .csv？

任何帮助是极大的赞赏。

Python版本：2.7.2

在 Python 2 中，csv模块不支持编写 Unicode。您需要在此处手动对其进行编码，否则您的 Unicode 值将使用 ASCII 进行编码（这就是您遇到编码异常的原因）。

这也意味着你需要手动编写UTF-8 BOM，但只有当你确实需要它时。 UTF-8 只能以一种方式写入，读取 UTF-8 文件不需要字节顺序标记。 Microsoft 喜欢将其添加到文件中，以便其工具更轻松地执行检测文件编码的任务，但 UTF-8 BOM 实际上可能会使其他工具更难正常工作，因为它们不会忽略额外的初始字符。

Use:

with open('EFSDUMP.csv', 'wb') as csv_file:
    csv_file.write(codecs.BOM_UTF8)
    content_writer = csv.writer(csv_file)
    content_writer.writerow([unicode(v).encode('utf8') for v in data.values()])

请注意，这将以任意（字典）顺序写入您的值。这unicode()call 会在编码之前先将非字符串类型转换为 unicode 字符串。

明确地说：您已经加载了 JSON 数据。它是CSV写入那对你来说失败了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 加载 UTF-8 JSON 的相关文章

如何（重新）命名 pandas 数据框中的空列标题而不导出到 csv

我有一个熊猫数据框df1带有一个索引列和一系列未命名的值我想为未命名的系列指定一个名称到目前为止我知道的唯一方法是导出到df1 csv using df1 to csv df1 csv header Signal 然后使用以下命令重新
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
如何为 Gson 编写自定义 JSON 反序列化器？

我有一个 Java 类用户 public class User int id String name Timestamp updateDate 我收到一个包含来自 Web 服务的用户对象的 JSON 列表 id 1 name Jonas
Matplotlib 图例，跨列添加项目而不是向下添加项目

对于下面的简单绘图有没有办法让 matplotlib 填充图例以便它从左到右填充行而不是第一列然后第二列 gt gt gt from pylab import gt gt gt x arange 2 pi 2 pi 0 1 gt gt
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error

随机推荐

我可以使用 git-svn 进行交互式代理身份验证吗？

我位于身份验证代理后面需要使用 https 访问远程 SVN 存储库git svn 代理是在我的中定义的 subversion servers file 当我开始时git svn fetch 我收到一条错误消息 RA 层请求失败的选项h
XMLHTTP 请求将 JSON 字符串作为原始发布数据传递

我的 JavasSript 发送请求 var jax new XMLHttpRequest jax open POST http localhost some php true jax setRequestHeader Content Ty
在 (bash? 中，转义单引号字符串中的单引号最美观的方法是什么？

在我的 ba sh 脚本中例如 MYVAR Alice says Hello Bob But Bob isn t listening 这是一个语法错误因为 inisn t结束单引号字符串我知道我可以使用以下方法修复此问题 MYVAR
Laravel 4 调试不起作用

非常令人沮丧的是我在应用程序配置中有 debug gt true 但 Laravel 显示的只是哎呀看起来出了问题出于对编码的热爱有人知道如何进行调试吗我也遇到过同样的问题 Laravel 仅显示哎呀看起来出了问题但这一行
使用 JavaScript 设置 f:param 值

是否可以这样做 jsf代码伪
从 Java 应用程序创建带有下标的 Graphviz 标签

我正在使用 Java 应用程序调用 GraphvizGraphviz java https github com jabbalaci graphviz java apiAPI 并将输出图形保存到 PDF 文件我需要用数学下标和重音符号来标
如何为SBT设置本地代理存储库？

我对 Maven Ivy 的了解几乎为零但知道这些技术是 SBT 自动下载和管理库的能力的背后当我尝试从 SBT 生成 IntelliJ Idea 项目时它 Idea 或生成器插件无法找到存储在公共 Ivy 2 缓存中的缓存库我通
在 CodeIgniter 中加载多种语言文件

我可以在 CodeIgniter 中为同一视图加载多个语言文件吗 ah 嗯这很简单我刚刚加载了两个文件 this gt lang gt load this gt lang gt load lang file1 this gt lang
如何在 Django 查询集中使用条件注释 Count

使用 Django ORM 可以做类似的事情吗queryset objects annotate Count queryset objects gte VALUE 明白我的意思了吗这是一个用于说明可能答案的简单示例在 Django 网站
更改媒体查询中的视口

我目前正在研究响应式网页设计智能手机视图尚未准备好因为我的客户必须获得更多预算因此我需要实现一个临时视图我想通过仅在智能手机上激活的固定视口来实现我以这种方式设置视口如果触发以下媒体查询我想将设备宽度更改为 700 像素
无法在 M1 Mac 上的 docker 容器中加载 nokogiri

我正在 M1 mac 上构建一个 Linux docker 镜像如果有的话可以从 ruby 3 0 2 alpine3 12 开始当我尝试在容器中执行捆绑执行时 ruby 抱怨它无法加载 nokogiri 如果我只是启动 ruby 并
在 Docker 中运行 Azure DevOps 作业时出现“无法找到给定版本的模块 Az.Accounts”错误

我在基于 ubuntu 16 04 的容器中安装 PowerShell 和 Az 模块 RUN curl https packages microsoft com keys microsoft asc apt key add wget ht
Git - 什么是“Refspec”

我一直在关注本指南 https medium com teeks99 continuous integration with jenkins and gitlab fa770c62e88a关于配置 GitLab 与 Jenkins 的持续集
在 django 迁移期间处理数据？

class Material models Model name models CharField max length 50 blank False short name models CharField max length 2 bla
C++ lambda 表达式的生命周期是多长？

我读过了C 中 lambda 派生的隐式函子的生命周期是多少 https stackoverflow com questions 5207467 what is lifetime of lambda derived implicit fun
在运行时从自定义 UITypeEditor 内部将自定义 TypeConverter 插入到属性上

我创建了一个自定义 UITypeEditor 我是否可以插入一个属性该属性也将 TypeConverter 附加到我的属性insideUITypeEditor 类我已经尝试过以下操作但无论我如何扭转和转动它都没有任何反应 Attri
conda“源停用”产生错误：参数太多

我正在尝试通过以下方式测试创建虚拟环境conda create这是我第一次真正涉足虚拟环境所以我仍在思考如何使用它们我的第一个测试是 conda create p users me anaconda envs envtest sourc
Lodash中的transform和reduce有什么区别

除了声明转换是减少的更强大的替代方案之外我找不到任何有关差异的文档 lodash中的transform和reduce有什么区别除了慢 25 http jsperf com transform vs reduce 我喜欢在引入实用程序
强制保存所有浏览器中的文件 - 不在浏览器窗口中打开

我正在寻找一个适用于所有浏览器的简单解决方案对于特定文件类型或通过类的目标链接如何让它们在所有主要浏览器中简单地强制下载我想我找到了 apache 服务器的完美解决方案通过将其添加到 htaccess 中 http css tric
Python 加载 UTF-8 JSON

我有以下 JSON 为简单起见我只使用一个但实际上有 100 个条目 Active false Book US Derivat London Mike bersax Michael Jealous ExpirationDate 2006

Python 加载 UTF-8 JSON

Python 加载 UTF-8 JSON 的相关文章

随机推荐

热门标签