拆分函数添加： \xef\xbb\xbf...\n 到我的列表

2023-12-14

我想打开我的file.txt并从此文件中分割所有数据。

这是我的file.txt:

some_data1 some_data2 some_data3 some_data4 some_data5

这是我的 python 代码：

>>>file_txt = open("file.txt", 'r')
>>>data = file_txt.read()
>>>data_list = data.split(' ')
>>>print data
some_data1 some_data2 some_data3 some_data4 some_data5
>>>print data_list
['\xef\xbb\xbfsome_data1', 'some_data1', "some_data1", 'some_data1', 'some_data1\n']

正如你在这里看到的，当我打印我的data_list它在我的列表中添加了以下内容：\xef\xbb\xbf和这个：\n。这些是什么以及如何清除我的列表中的它们。

Thanks.

您的文件包含UTF-8 BOM在一开始的时候。

要摆脱它，首先将文件内容解码为 unicode。

fp = open("file.txt")
data = fp.read().decode("utf-8-sig").encode("utf-8")

但最好不要将其编码回utf-8，但与unicoded 文本。有一个很好的规则：尽快将所有输入的文本数据解码为 unicode，并且仅使用 unicode；并尽可能晚地将输出数据编码为所需的编码。这将使您免于许多头痛。

要以某种编码读取更大的文件，请使用io.open or codecs.open.

另请检查this.

Use str.strip() or str.rstrip()摆脱换行符\n.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

split

拆分函数添加： \xef\xbb\xbf...\n 到我的列表的相关文章

围绕 readline 构建的 python 批处理的触发器选项卡完成

背景我有一个 python 程序它导入并使用 readline 模块来构建自制的命令行界面我有第二个 python 程序围绕 Bottle 一个 Web 微框架构建充当该 CLI 的前端第二个 python 程序向第一个程序打开
从数据框中按索引删除行

我有一个数组wrong indexes train其中包含我想从数据框中删除的索引列表 0 63 151 469 1008 要删除这些索引我正在尝试这样做 df train drop wrong indexes train 但是代码失败
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M

随机推荐

如果 findFirst() 找到的第一个元素为 null，为什么会抛出 NullPointerException？

为什么这会抛出一个java lang NullPointerException List
运行时错误和编译器错误有什么区别？ [复制]

这个问题在这里已经有答案了在我的一张关于多态性的教授幻灯片中我看到这段代码带有一些注释 discountVariable will produce DiscountSale saleVariable run time error dis
从 pandas 的日期时间列中减去年份

我有一个日期时间列如下 gt gt gt df ACC DATE head 2 538 2006 04 07 550 2006 04 12 Name ACC DATE dtype datetime64 ns 现在我想从此列的每一行中减去一
凯拉斯 TPU。编译失败：检测到不支持的操作

我尝试使用 Google Colab TPU 运行我的 keras UNet 模型但遇到了这个问题UpSampling2D 有什么解决方案或解决方法吗要运行的代码 import os import numpy as np import
通知未被忽略 (Android)

如果单击操作通知 setAutoCancel true 不起作用我有一个通知其中包含一个操作当我点击通知时它将从列表中删除但是当我单击操作时它成功完成了操作即进行呼叫但当我返回到通知列表时它仍保留在那里 Alar
如何在 HTTP 重定向上转发标头

我正在编写一个响应 HTTP 重定向的 Web 应用程序有没有办法强制客户端将我在响应中包含的标头转发到新网址请求示例 POST insertion HTTP 1 1 Content Length 9 content 网络应用响应 HT
在 OpenModelica 中模拟闭式液压循环

我想对一个封闭的液压循环进行建模正如人们可以在 Modelica 标准库流体示例加热系统中找到的那样对于供暖系统以及我的简约示例我遇到了同样的问题系统是超定的在接下来的讲座中您可以发现加热系统是一个坏例子所以我想这
Swift 中集合视图的横向方向

我的集合视图单元格遇到横向问题当应用程序处于纵向时它为我提供每行正确的单元格数量即 2 但是当我将应用程序旋转到横向时它每行显示 1 个单元格这是我得到的屏幕 Portrait Landscape 这是我添加单元格大小的代码 fu
启动程序时出现“找不到主方法”错误？ [复制]

这个问题在这里已经有答案了我正在为我的课程学习 Java 但我遇到了障碍我的任务是开发一个简单的命令行程序为了让事情变得更容易我提供了以下示例代码进行修改这样我就不必从头开始 package assignment public c
如果服务器文件夹中存在文件，如何执行 SQL Server 代理作业？

我需要每天导入一个平面文件该文件每天都会更改名称文件处理后需要将其移动到另一个文件夹我注意到我可以在 SQL Server 代理中安排作业并且可以告诉它每小时左右运行一次并且我可以向其中添加 CMD 命令我找到的解决方案是运行
如何在Python查询中按名称获取字段？

我在Python脚本中使用Mysql连接如何按名称从表中获取结果 cursor conn cursor cursor execute SELECT FROM local 现在我通过索引来做到这一点 results cursor fetch
使用 VBA 合并 Excel 工作表

我有一个 Excel 工作表例如 OG xls 其中已有一些数据其中有大约 5000 行标题位于第一行最多为 AN 列这个行数 5000 全年都不会改变现在我有 5 个 XL 文件比如 A B C D E 这些文件中的数据每次
使用批处理根据分辨率重命名我的视频文件

我想根据视频文件的分辨率重命名它们例如对于 1080p 的视频 bla bla mp4 我想将其重命名为 bla bla H 264 1080p 该脚本应该能够自动检测视频的分辨率而且如果文件已经被重命名则不应重命名它我无法找到检
使用 iPhone 在 UIView 中嵌入视频

我想编写一个在视图中下载或流式传输视频根据需要编码的应用程序我不想使用 SDK 中的 MPVideoPlayer 因为它会全屏打开视频我想在视频上放置另一个 UIView 透明以便我的用户可以在视频上进行注释任何人有任何想法
限制 App Engine 对自定义域中的 G Suite 帐户的访问

不久前 Google Apps 现在称为 G Suite 域的 App Engine 相关设置已移至 Google Cloud Console 截至目前限制关联 G Suite 用户访问 App Engine 实例的记录方法是通过此 Go
在 Jquery 中选择元素之前的同级？

DOM 看起来像这样 div A div div B div div C div div D div div E div div F div div G div 现在我可以选择 div D div using div selected 那么
setInterval at 1ms 似乎实际上不是 1ms

我正在尝试使用 HTTPRequest 来计算下载文件所需的时间如下所示 function getFile use strict var url data bin var rawFile new XMLHttpRequest var ti
Openssl 和 PHP

我正在尝试使用 PHP 加载 openssl cli 工具生成的私钥我使用了以下命令和 PHP 代码 openssl genrsa des3 4096 out private key if key openssl pkey get pri
来自纬度经度位置的国家/地区代码（不使用地理编码服务）

如何从纬度经度位置获取国家地区代码我知道有许多地理编码服务可用但它们不能满足我的要求因为我的应用程序在上线几个小时后就被阻止许多地理编码请求大多数地理编码服务还提供商业服务但它们还不是一种选择因为该项目还处于起步阶段我做了
拆分函数添加： \xef\xbb\xbf...\n 到我的列表

我想打开我的file txt并从此文件中分割所有数据这是我的file txt some data1 some data2 some data3 some data4 some data5 这是我的 python 代码 gt gt gt f

拆分函数添加： \xef\xbb\xbf...\n 到我的列表

拆分函数添加： \xef\xbb\xbf...\n 到我的列表 的相关文章

随机推荐

热门标签

拆分函数添加： \xef\xbb\xbf...\n 到我的列表的相关文章