拆分函数添加: \xef\xbb\xbf...\n 到我的列表

2023-12-14

我想打开我的file.txt并从此文件中分割所有数据。

这是我的file.txt:

some_data1 some_data2 some_data3 some_data4 some_data5

这是我的 python 代码:

>>>file_txt = open("file.txt", 'r')
>>>data = file_txt.read()
>>>data_list = data.split(' ')
>>>print data
some_data1 some_data2 some_data3 some_data4 some_data5
>>>print data_list
['\xef\xbb\xbfsome_data1', 'some_data1', "some_data1", 'some_data1', 'some_data1\n']

正如你在这里看到的,当我打印我的data_list它在我的列表中添加了以下内容:\xef\xbb\xbf和这个:\n。这些是什么以及如何清除我的列表中的它们。

Thanks.


您的文件包含UTF-8 BOM在一开始的时候。

要摆脱它,首先将文件内容解码为 un​​icode。

fp = open("file.txt")
data = fp.read().decode("utf-8-sig").encode("utf-8")

但最好不要将其编码回utf-8,但与unicoded 文本。有一个很好的规则:尽快将所有输入的文本数据解码为 un​​icode,并且仅使用 unicode;并尽可能晚地将输出数据编码为所需的编码。这将使您免于许多头痛。

要以某种编码读取更大的文件,请使用io.open or codecs.open.

另请检查this.

Use str.strip() or str.rstrip()摆脱换行符\n.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

拆分函数添加: \xef\xbb\xbf...\n 到我的列表 的相关文章

随机推荐

  • 如果 findFirst() 找到的第一个元素为 null,为什么会抛出 NullPointerException?

    为什么这会抛出一个java lang NullPointerException List
  • 运行时错误和编译器错误有什么区别? [复制]

    这个问题在这里已经有答案了 在我的一张关于多态性的教授幻灯片中 我看到这段代码带有一些注释 discountVariable will produce DiscountSale saleVariable run time error dis
  • 从 pandas 的日期时间列中减去年份

    我有一个日期时间列如下 gt gt gt df ACC DATE head 2 538 2006 04 07 550 2006 04 12 Name ACC DATE dtype datetime64 ns 现在 我想从此列的每一行中减去一
  • 凯拉斯 TPU。编译失败:检测到不支持的操作

    我尝试使用 Google Colab TPU 运行我的 keras UNet 模型 但遇到了这个问题UpSampling2D 有什么解决方案或解决方法吗 要运行的代码 import os import numpy as np import
  • 通知未被忽略 (Android)

    如果单击操作 通知 setAutoCancel true 不起作用 我有一个通知 其中包含一个操作 当我点击通知时 它将从列表中删除 但是 当我单击 操作 时 它成功完成了 操作 即进行呼叫 但当我返回到通知列表时 它仍保留在那里 Alar
  • 如何在 HTTP 重定向上转发标头

    我正在编写一个响应 HTTP 重定向的 Web 应用程序 有没有办法强制客户端将我在响应中包含的标头转发到新网址 请求示例 POST insertion HTTP 1 1 Content Length 9 content 网络应用响应 HT
  • 在 OpenModelica 中模拟闭式液压循环

    我想对一个封闭的液压循环进行建模 正如人们可以在 Modelica 标准库 流体 示例 加热系统中找到的那样 对于供暖系统以及我的 简约 示例 我遇到了同样的问题 系统是超定的 在接下来的讲座中 您可以发现加热系统是一个 坏例子 所以我想这
  • Swift 中集合视图的横向方向

    我的集合视图单元格遇到横向问题 当应用程序处于纵向时 它为我提供每行正确的单元格数量 即 2 但是当我将应用程序旋转到横向时 它每行显示 1 个单元格 这是我得到的屏幕 Portrait Landscape 这是我添加单元格大小的代码 fu
  • 启动程序时出现“找不到主方法”错误? [复制]

    这个问题在这里已经有答案了 我正在为我的课程学习 Java 但我遇到了障碍 我的任务是开发一个简单的命令行程序 为了让事情变得更容易 我提供了以下示例代码进行修改 这样我就不必从头开始 package assignment public c
  • 如果服务器文件夹中存在文件,如何执行 SQL Server 代理作业?

    我需要每天导入一个平面文件 该文件每天都会更改名称 文件处理后 需要将其移动到另一个文件夹 我注意到我可以在 SQL Server 代理中安排作业 并且可以告诉它每小时左右运行一次 并且我可以向其中添加 CMD 命令 我找到的解决方案是运行
  • 如何在Python查询中按名称获取字段?

    我在Python脚本中使用Mysql连接 如何按名称从表中获取结果 cursor conn cursor cursor execute SELECT FROM local 现在我通过索引来做到这一点 results cursor fetch
  • 使用 VBA 合并 Excel 工作表

    我有一个 Excel 工作表 例如 OG xls 其中已有一些数据 其中有大约 5000 行 标题位于第一行 最多为 AN 列 这个行数 5000 全年都不会改变 现在我有 5 个 XL 文件 比如 A B C D E 这些文件中的数据每次
  • 使用批处理根据分辨率重命名我的视频文件

    我想根据视频文件的分辨率重命名它们 例如 对于 1080p 的视频 bla bla mp4 我想将其重命名为 bla bla H 264 1080p 该脚本应该能够自动检测视频的分辨率 而且如果文件已经被重命名 则不应重命名它 我无法找到检
  • 使用 iPhone 在 UIView 中嵌入视频

    我想编写一个在视图中下载 或流式传输 视频 根据需要编码 的应用程序 我不想使用 SDK 中的 MPVideoPlayer 因为它会全屏打开视频 我想在视频上放置另一个 UIView 透明 以便我的用户可以在视频上进行注释 任何人有任何想法
  • 限制 App Engine 对自定义域中的 G Suite 帐户的访问

    不久前 Google Apps 现在称为 G Suite 域的 App Engine 相关设置已移至 Google Cloud Console 截至目前 限制关联 G Suite 用户访问 App Engine 实例的记录方法是通过此 Go
  • 在 Jquery 中选择元素之前的同级?

    DOM 看起来像这样 div A div div B div div C div div D div div E div div F div div G div 现在我可以选择 div D div using div selected 那么
  • setInterval at 1ms 似乎实际上不是 1ms

    我正在尝试使用 HTTPRequest 来计算下载文件所需的时间 如下所示 function getFile use strict var url data bin var rawFile new XMLHttpRequest var ti
  • Openssl 和 PHP

    我正在尝试使用 PHP 加载 openssl cli 工具生成的私钥 我使用了以下命令和 PHP 代码 openssl genrsa des3 4096 out private key if key openssl pkey get pri
  • 来自纬度经度位置的国家/地区代码(不使用地理编码服务)

    如何从纬度经度位置获取国家 地区代码 我知道有许多地理编码服务可用 但它们不能满足我的要求 因为我的应用程序在上线几个小时后就被阻止 许多地理编码请求 大多数地理编码服务还提供商业服务 但它们还不是一种选择 因为该项目还处于起步阶段 我做了
  • 拆分函数添加: \xef\xbb\xbf...\n 到我的列表

    我想打开我的file txt并从此文件中分割所有数据 这是我的file txt some data1 some data2 some data3 some data4 some data5 这是我的 python 代码 gt gt gt f