附加到末尾时，python utf-8-sig BOM 位于文件中间

2023-11-26

我最近注意到 Python 在使用以下命令附加到文件时的行为方式并不明显utf-8-sig编码。见下文：

>>> import codecs, os
>>> os.path.isfile('123')
False
>>> codecs.open('123', 'a', encoding='utf-8-sig').write('123\n')
>>> codecs.open('123', 'a', encoding='utf-8-sig').write('123\n')

文件中包含以下文本：

<BOM>123
<BOM>123

这不是一个错误吗？这太不符合逻辑了。谁能向我解释为什么这样做？为什么他们不设法仅在文件不存在且需要创建时才添加 BOM？

不，这不是错误；而是错误。这是完全正常的、预期的行为。编解码器无法检测文件中已经写入了多少内容；你可以用它来附加到预先创建的但是empty例如文件。该文件不是新文件，但也不包含 BOM。

还有其他用例，其中编解码器用于流或字节串（例如，不与codecs.open()）哪里有根本没有文件进行测试，或者开发人员想要在输出开始时强制执行 BOM。

仅使用utf-8-sig on a new文件;编解码器将always每次使用时都将 BOM 写出来。

如果您直接使用文件，您可以自己开始测试；使用utf-8相反，手动编写 BOM，这只是一个编码的U+FEFF 零宽度不间断空格:

import io

with io.open(filename, 'a', encoding='utf8') as outfh:
    if outfh.tell() == 0:
        # start of file
        outfh.write(u'\ufeff')

我用的是较新的io.open()代替codecs.open(); io是为 Python 3 开发的新 I/O 框架，比codecs根据我的经验，用于处理编码文件。

请注意，UTF-8 BOM 确实几乎毫无用处。 UTF-8没有可变字节顺序，所以只有one字节顺序标记。另一方面，UTF-16 或 UTF-32 可以使用两种不同的字节顺序之一编写，这就是需要 BOM 的原因。

UTF-8 BOM 主要由 Microsoft 产品用来自动检测文件的编码（例如not遗留代码页之一）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

UTF8

byteordermark

附加到末尾时，python utf-8-sig BOM 位于文件中间的相关文章

从 Django 调用 Postgres SQL 存储过程

我正在开发一个带有 Postgresql 数据库的 Django 项目我编写了一个可以在 Postgres 上完美运行的存储过程现在我想从 Django 1 5 调用该存储过程我已经编写了代码但它提示错误 CREATE FUNCTI
有没有一种方法可以将python对象直接存储在mongoDB中而不需要序列化它们

我在某处读到过您可以使用 BSON 将 python 对象更具体地说是字典作为二进制文件存储在 MongoDB 中但是现在我找不到任何与此相关的文档有人知道具体如何做到这一点吗没有办法在不序列化的情况下将对象存储在文件数据库
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

NodeRT：找不到程序集

我正在写一个electron应用程序与电子窗口通知这取决于NodeRT 当我尝试安装我的项目时每个项目都会出现以下错误 nodert win10依赖项 gt if not defined npm config node gyp node
IOS 11 Beta 上的 cordova 的 html-select 下拉问题

我目前使用 AngularJS 和 Cordova 构建一个 IOS 应用程序当我在 IOS 11 Beta 上尝试我的应用程序时我发现了一个错误要选择表单中的某些数据我们使用 select dropDown 当我们选择一个值时下
Docker，无法使用 docker flag -p 3000:3000 从 localhost:3000 访问“rails 服务器”开发

我正在尝试将 docker 与 Rails 结合使用在一个容器内构建整个堆栈我的最终目标是拥有一个 nginx memcached unicorn rails postgres 堆栈并以 runit 作为进程管理器到目前为止我已经
如何将 std::chrono::time_point 转换为带有小数秒的日历日期时间字符串？

如何转换std chrono time point带有小数秒的日历日期时间字符串例如 10 10 2012 12 38 40 123456 如system clock 该类有time t转换 include
获取网格中的绝对行号

在yii的网格视图我可以通过使用获取当前行号 row 但这仅返回当前页面内的行索引我真正需要的是获取所有页面中的绝对行号我正在使用 yii 所以我的梦想应该轻松实现所以我希望答案不应该引导我向数据提供程序添加特殊字段或访问寻呼机并
将用户标头搜索路径添加到 podspec

这是这个问题的后续 CocoaPods 可能有一个包含主应用程序的搜索路径我想添加添加一个User Header Search Path到我的 podspec 以便在编译时添加它但我不知道如何执行此操作其效果如下将此代码添加到您的
javascript Replace() 没有替换所有匹配的字符

我想转管理员电影列表 into Admin 电影列表 using 代替 var id id replace 看起来它只替换了第一个我如何替换所有这些谢谢你的帮助 Use a regex with the g flag var id
使用 XmlTextReader

我是一名初级程序员从 C 和 Web 服务开始 In the Service cs我的网络服务文件我创建一个ReadXMLFile 方法我尝试读取现有的 XML 文件从中获取数据并将其放置到我在IService cs file 我的
Entity Framework Core、DELETE CASCADE 和 [必需]

我在 Entity Framework Core 中遇到了 DELETE CASCADE 问题我似乎找不到好的解决方案这是我的模型的超级简化版本 User UserID Name Recipe RecipeID UserID Ingre
PowerShell 中数字后缀的完整列表是什么？

可在 PowerShell 数字文字上使用的后缀的完整列表是什么到目前为止我已经发现 Suffix Example Result L 1L Type Int64 D 1D Type Decimal KB 1KB 1KB 1024 MB 1
通过 HTTP 中间件验证 WebSocket 连接

问题陈述我正在尝试使用 Golang 中的基本中间件来保护 websocket 升级程序 http 端点如下所示WebSocket 协议不处理授权或身份验证社区建议有些人建议尽管含糊其辞我建议使用应用程序的代码来验证升级握手以
apache中这个配置是什么意思？ [关闭]

Closed 这个问题是无关目前不接受答案 Header append Vary User Agent env dont vary 谁能对此给出详细的解释这使用阿帕奇模组头将值 User Agent 附加到 Vary HTTP 标头但
在哪里可以找到 iPhone 上的 Quartz 2D 绘图示例？

我将使用 Quartz 在 Iphone 中开发 2D 游戏 Quartz 和 QuartzCore 之间的主要区别是什么我在互联网上搜索了很多但只能找到带有 Quartz Examples 的 MAC OS 如果任何机构有任何使用 I
如何使用具有该属性名称的字符串变量访问对象属性？

我如何在 C 中执行此操作 using System namespace TestProperties28373 class Program static void Main string args Customer customer ne
查询数组大小大于1的文档

我有一个 MongoDB 集合其中包含以下格式的文档 id ObjectId 4e8ae86d08101908e1000001 name Name zipcode 2223 id ObjectId 4e8ae86d08101908e100
如何为 CSS 自定义属性设置“inherit”值？ [复制]

这个问题在这里已经有答案了将自定义属性设置为值inherit完全符合您对其他所有 CSS 属性的期望它继承其父级的相同属性值普通财产继承
为什么集合初始值设定项末尾可以有逗号？

这个问题一直让我困惑但我猜对于为什么会发生这种情况有一个非常合理的解释当您有集合初始值设定项时编译器允许尾随逗号例如 new Dictionary
是否有一个 cordova 插件可以从 config.xml 读取值？

我希望从我的 Cordova PhoneGap 应用程序中读取这些值config xml在运行时 name 版权描述然而很惊讶地发现没有 ConfigAPI 参考指南中的功能 http cordova apache org docs
如何知道片段何时在 viewpager 中实际可见

我在 ViewPager 中使用 4 个片段因为 ViewPager 提前加载上一个和下一个片段并且在片段之间导航时不会调用生命周期方法那么有没有什么方法可以检测 Fragment 何时真正可见提前致谢根据 Matt的回答setU
附加到末尾时，python utf-8-sig BOM 位于文件中间

我最近注意到 Python 在使用以下命令附加到文件时的行为方式并不明显utf 8 sig编码见下文 gt gt gt import codecs os gt gt gt os path isfile 123 False gt gt gt

附加到末尾时，python utf-8-sig BOM 位于文件中间

附加到末尾时，python utf-8-sig BOM 位于文件中间 的相关文章

随机推荐

热门标签

附加到末尾时，python utf-8-sig BOM 位于文件中间的相关文章