python pandas 特殊字符作为分隔符

2024-04-26

我有一个带有特殊字符 [˛] 作为分隔符的文本文件。我在 read_csv 命令中复制粘贴了这个特殊字符作为分隔符，但出现以下错误：

ParserWarning: Falling back to the 'python' engine because the 
separator encoded in utf-8 is > 1 char long, and the 'c' engine does 
not support such separators; you can avoid this warning by specifying 
engine='python'.
  """Entry point for launching an IPython kernel.

知道如何在读取文本文件时使用特殊字符吗？

您只会收到警告和解决方案，删除它非常简单 - 添加engine='python'.

指定解析器引擎 http://pandas.pydata.org/pandas-docs/stable/io.html#specifying-the-parser-engine:

在底层，pandas 使用了一个快速高效的解析器，它的实现是C以及目前功能更完整的 python 实现。在可能的情况下 pandas 使用 C 解析器（指定为engine='c'），但如果指定了 C 不支持的选项，则可能会回退到 python。目前，C 语言不支持的选项包括：

sep 不是单个字符（例如正则表达式分隔符）
跳页脚
sep=无 delim_whitespace=False

指定上述任何选项都会产生 ParserWarning，除非使用显式选择 python 引擎engine='python'.

import pandas as pd
from pandas.compat import StringIO

temp=u"""a˛b˛c
1˛3˛5
7˛8˛1
"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="˛", engine='python')
print (df)
   a  b  c
0  1  3  5
1  7  8  1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

csv

pandas

python pandas 特殊字符作为分隔符的相关文章

如何使用电子表格中的第一行作为 Dataframe 列名称而不是 0 1 2...等？

我希望我的数据框将第一行名称显示为数据框列名称而不是从 0 等编号我该如何执行此操作我尝试使用 pandas 和 openpyxl 模块将我的 Excel 电子表格转换为数据框 import pandas as pd from ope
使用按钮从 Django 项目根下载文件

So this is the webpage I m creating atm with Django 1 8 希望用户能够将数据导出为 csv 当用户在框中写下 Reddit 子版块名称按下获取数据按钮会发生什么它创建了一个
将yield语句转换为Python中的生成器表达式

我有一个关于将yield语句转换为生成器表达式的问题所以我有一个小的yield方法它获取一个函数和一个起始数字作为其输入并且基本上为每个先前被调用的数字调用该函数即第一次调用返回初始号码第二次调用返回函数初始编号第三次调用返
每个 id 创建 n 行 |熊猫

我有一个数据框df如下 id lob addr addr2 a1 001 1234 0 a1 001 1233 0 a3 003 1221 0 a4 009 1234 0 我想生成n 让我们每个 id 取 4 行其他列是null na n
Pandas MultiIndex 按分类顺序自定义排序级别，而不是按字母顺序

我是 Pandas 0 16 1 的新手并且希望在多索引中进行自定义排序因此我使用分类我的多重索引的一部分 Part Defect Own 504 504 504 505 506 507 530 530 530 我创建了具有多索引级别
在Python子目录中创建文件？

在我的 Python 脚本中我需要在子目录中创建一个新文件而不更改目录并且需要从当前目录不断编辑该文件 My code os mkdir datetime dst for ip in open list txt with open ip
pandas 使用查询功能检查列是否为空

我有 pandas 数据框我想在它的查询函数上执行 isnull 或 not isnull 条件如下所示 In 67 df data pd DataFrame a 1 20 None 40 50 In 68 df data Out 68
Pandas 无法读取使用 h5py 创建的 hdf5 文件

当我尝试读取使用 h5py 创建的 HDF5 格式文件时出现 pandas 错误我想知道我是否只是做错了什么 import h5py import numpy as np import pandas as pd h5 file h5py
是否可以将 SpaCy 安装到 Raspberry Pi 4 Raspbian Buster

我一整天都在安装 SpaCy sudo pip install U spacy Looking in indexes https pypi org simple https www piwheels org simple Collectin
找不到 Jupyter 命令 `jupyter-lab`

我尝试在我的 Kubuntu 机器上安装 jupyter lab 如果我使用 pip3 install jupyter jupyterlab 安装 jupyter lab 则命令 jupyter notebook 完全可以正常工作但是如
将 word2vec 模型查询的结果保存在 csv 文件中？

我正在语料库上训练 word2vec 模型然后查询该模型这工作正常但我正在运行一个实验需要针对不同的条件调用模型保存每个条件的模型查询每个条件的模型然后将查询的输出保存到 csv 文件中例如进一步分析所有条件我研究了 ge
从“stdin”读取文件后如何使用“input()”？

Context 我想要一个简单的脚本它可以选择多个管道输入中的一个而不需要EOF when reading a lineUnix Linux 上的错误它试图接受多行管道文本等待用户选择一个选项将该选项打印到标准输出所需用途 p
使用 pandas to_datetime 时如何定义格式？

我想根据以下内容绘制结果与时间的关系图testresult csv文件具有以下格式并且我无法正确定义 TIME 列的数据类型 TIME RESULT 03 24 2016 12 27 11 AM 2 03 24 2016 12 28 41
如何测量异步发电机所花费的时间？

我想测量生成器花费的时间阻塞主循环的时间假设我有以下两个生成器 async def run for i in range 5 await asyncio sleep 0 2 yield i return async def walk f
Bash：查找并连接文件

我有以下结构 home DIR1 file ab csv DIR2 file cd csv DIR3 file3 ef csv Where file csv包含多行浮点数每个 DIR 都有不同的浮点数我想抓取所有的内容file csv文
什么时候会在 dict 上使用键值对作为 dict.update 方法？

我注意到你可以做两件事来更新字典并且它们似乎有相同的结果 a a update foo 1 a a update foo 1 两者都会产生如下所示的字典结果 foo 1 是否有任何理由更喜欢使用字典或键值对作为更新方法它们在功能上是否
导入 csv 文件数据以填充 Prolog 知识库

我有一个 csv 文件example csv其中包含两列标题为 var1 和 var2 我想填充一个最初为空的 Prolog 知识库文件import pl具有重复的事实而每一行example csv处理方式相同 fact A1 A2 f
填充 MultiIndex Pandas Dataframe 中的日期空白

我想修改 pandas MultiIndex DataFrame 以便每个索引组都包含指定范围内的日期我希望每个组都用值 0 或NaN Group A Group B Date Value loc a group a 2013 06 11
Pandas dataframe ，使用 iloc 替换最后一行

我正在尝试使用 iloc 替换 Pandas 数据帧的最后一行但是我无法让它工作有很多解决方案但最简单最慢的是这里如何在 Python 中对 Pandas 数据帧上的行进行 FIFO 推送操作 https stackoverfl
Pandas DataFrame 中多列的映射方法

我有一个 Pandas 数据框其中的值是列表 import pandas as pd DF pd DataFrame X 1 5 1 2 Y 1 2 5 1 3 5 DF X Y 0 1 5 1 2 5 1 1 2 1 3 5 我想检查

随机推荐

更改永久链接 WordPress 后出现 404 错误

我的网站是一个Wordpress site创建于PHP 我已将永久链接默认更改为帖子名称它工作得很好Chrome and Firefox但在 IE8 中不行首页显示正确但当我单击另一个页面的链接时它显示 404 页面未找到错误我使
Hibernate不生成级联

我有一套hibernate hbm2ddl auto创建以便 Hibernate 为我在 mysql 中创建表但是休眠似乎没有正确添加Cascade关于表中的参考文献然而当我删除一行并且我有一个删除级联作为休眠注释时它确实有效
强制 C++ 编译器检查异常处理

我想知道是否有一些编译器参数最好是在 gcc g 中它将缺少 try catch 块视为错误这是java中的标准行为我一直很喜欢它由于 Java 中的检查异常依赖于throw签名您可以阅读为什么您不想使用throwC 中的函数签
MySQL 唯一 id 或组合 id

我的项目和开发人员计划的结构如下 developer table id developer name etc project table id project name etc developer project table 因为一个开发人
php zlib：如何从字符串变量动态创建内存中的zip文件？

这就是我需要的 a array folder gt anyfolder filename gt anyfilename filedata gt anyfiledata 我需要使用 a 中的压缩数据创建一个变量 zip 并将此 zip 输出到
Sass 更改监视间隔，更频繁地编译

我正在使用 sass 将 scss 编译为 css 每次保存后大约需要 15 20 秒才能编译为 scss 文件到 css 因此我需要刷新几次才能看到预期结果有没有办法告诉 Sass 更频繁地检查更改这是我使用的命令 sass wat
C# 中的随机数 [重复]

这个问题在这里已经有答案了可能的重复随机数生成器没有按我计划的方式工作 C https stackoverflow com questions 767999 random number generator not working the
SharePoint 404 页面

最好的位置是在 web config customError 部分中为 SharePoint 设置 404 错误页面还是网站集 Web 应用程序上有配置设置请阅读这个博客 http blogs msdn com jingmeili ar
退出 glutFullScreen()

我不明白为什么当我按 f 时它进入全屏但不退出全屏在这个方法的开头我已经设置了bool fullscreen false 这是我的切换代码 case f toggle screenmode if fullscreen glutFullSc
如何在 r 中绘制 LDA 的双标图？

我使用该函数进行了线性判别分析lda 来自 MASS 包现在我会尝试绘制像 ade4 包 forLDA 中那样的双标图你知道我该怎么做吗如果我尝试使用biplot 功能不起作用例如如果我使用 Iris 数据并制作 LDA dis2
如何在 Scala Slick 中运行补丁/部分数据库更新？

我们想运行补丁部分UPDATE使用 Slick 3 0 0 以便我们只修改记录中的某些字段确切地说哪些字段将被更新只有在运行时才知道例如对于一个REST PATCH request http restcookbook com HTT
C++11 中引入的可选固定宽度整数类型的支持状态

C 11终于引入了固定宽度整数类型
如果单元格为空白，如何停止公式？

如果左侧单元格中没有数据如何停止公式运行我正在尝试弄清楚如何使用固定时间和动态时钟来显示经过的时间我的固定时间在 Cell D5 中动态时钟在 Cell 中J4 附图为了计算出经过的时间我的公式如下 J4 D5 效果很好但是
d3.js：是否可以通过键而不是索引来进行转换？

我有不同长度的数据数组 x值年是有限年数的一部分例如 var data Year 2008 Value 5 Year 2009 Value 6 or var data Year 2007 Value 8 Year 2009 Value
WordPress 操作钩子未触发（wpforms）

最终完成了一个包含 WordPress 网站的项目我正在尝试将 WPforms 制作的表单中的数据发布到外部 API 不是一个 WordPress 专家但我读到我可以通过编写自己的插件来连接其他插件的操作这是我的插件
Ember.js + Mirage：在集成测试中拉取模拟关系

我有一个使用的组件this get model property 并且它按预期工作对于我的集成测试我使用 Mirage 它适用于我的所有其他测试包括集成测试但是当我测试这个特定组件时我得到 TypeError Cannot rea
使用 goto 跳过变量声明？

我在读C 编程现代方法由 K N King 学习 C 编程语言并指出goto语句不得跳过可变长度数组声明但现在的问题是为什么goto跳转允许跳过固定长度数组声明和普通声明吗更准确地说根据 C99 标准此类示例的行为是什么当
onErrorResume 和 doOnError 的区别

Spring项目Reactor中有什么区别onErrorResume and doOnError 我什么时候应该每个人 onErrorResume 当上游发生异常时提供回退流 doOnError 副作用运算符假设您想记录上游发生的错误
有没有一种方法可以在不登录用户的情况下使用 Adobe Creative SDK？

Aviary 不需要用户进行任何登录我想使用它但 Creative SDK 要求用户登录 Adob e 帐户我只想能够在设备上进行简单的编辑这可能吗图像编辑器和授权目前 Creative SDK 图像编辑器组件不需要登录并且未来
python pandas 特殊字符作为分隔符

我有一个带有特殊字符作为分隔符的文本文件我在 read csv 命令中复制粘贴了这个特殊字符作为分隔符但出现以下错误 ParserWarning Falling back to the python engine because th

python pandas 特殊字符作为分隔符

python pandas 特殊字符作为分隔符 的相关文章

随机推荐

热门标签

python pandas 特殊字符作为分隔符的相关文章