pandas dataframe读取csv，其中行末尾有/没有逗号

2023-12-26

我的示例文件如下所示：

1.50424e+09,164.84,164.94,163.4,164.07,09:30:00,1.50424e+12,eAAPL,1.38904e+07,0,22.45,2.64333e+07,847097,18.49,1.54
1.50459e+09,163.8,164.25,158.26,162.2,09:30:00,1.50459e+12,eAAPL,2.54615e+07,0,22.44,2.64646e+07,847097,18.49,1.54
1.50467e+09,162.71,162.99,160.52,162.01,09:30:00,1.50467e+12,eAAPL,1.67919e+07,0,22.67,2.61136e+07,837180,18.27,1.55
1.50485e+09,160.9,161.15,158.62,158.7,09:30:00,1.50485e+12,eAAPL,2.02651e+07,0,22.73,2.48843e+07,832945,18.18,1.56,
1.50511e+09,160.51,162.05,159.89,161.48,09:30:00,1.50511e+12,eAAPL,2.44948e+07,0,22.54,2.50082e+07,819360,17.88,1.59,
1.50476e+09,162.17,163.69,160.36,161.175,09:30:00,1.50476e+12,eAAPL,1.88933e+07,0,22.68,2.58778e+07,836302,18.25,1.56,

请滚动到最右边，您将看到前 3 行末尾没有逗号，但最后 3 行有逗号。当我做

f = pd.read_csv("AAPL.csv", header=None)

它给出错误说：

CParserError: Error tokenizing data. C error: Expected 15 fields in line 4, saw 16

我如何解决它？

你可以使用usecols with np.arange(0,15)，忽略 csv 文件底部三行的尾随列：

from io import StringIO
file = StringIO("""1.50424e+09,164.84,164.94,163.4,164.07,09:30:00,1.50424e+12,eAAPL,1.38904e+07,0,22.45,2.64333e+07,847097,18.49,1.54
1.50459e+09,163.8,164.25,158.26,162.2,09:30:00,1.50459e+12,eAAPL,2.54615e+07,0,22.44,2.64646e+07,847097,18.49,1.54
1.50467e+09,162.71,162.99,160.52,162.01,09:30:00,1.50467e+12,eAAPL,1.67919e+07,0,22.67,2.61136e+07,837180,18.27,1.55
1.50485e+09,160.9,161.15,158.62,158.7,09:30:00,1.50485e+12,eAAPL,2.02651e+07,0,22.73,2.48843e+07,832945,18.18,1.56,
1.50511e+09,160.51,162.05,159.89,161.48,09:30:00,1.50511e+12,eAAPL,2.44948e+07,0,22.54,2.50082e+07,819360,17.88,1.59,
1.50476e+09,162.17,163.69,160.36,161.175,09:30:00,1.50476e+12,eAAPL,1.88933e+07,0,22.68,2.58778e+07,836302,18.25,1.56,""")

f = pd.read_csv(file, usecols=np.arange(0,15), header=None)

print(f.head())

Output:

             0       1       2       3       4         5             6   \
0  1.504240e+09  164.84  164.94  163.40  164.07  09:30:00  1.504240e+12   
1  1.504590e+09  163.80  164.25  158.26  162.20  09:30:00  1.504590e+12   
2  1.504670e+09  162.71  162.99  160.52  162.01  09:30:00  1.504670e+12   
3  1.504850e+09  160.90  161.15  158.62  158.70  09:30:00  1.504850e+12   
4  1.505110e+09  160.51  162.05  159.89  161.48  09:30:00  1.505110e+12   

      7           8   9      10          11      12     13    14  
0  eAAPL  13890400.0   0  22.45  26433300.0  847097  18.49  1.54  
1  eAAPL  25461500.0   0  22.44  26464600.0  847097  18.49  1.54  
2  eAAPL  16791900.0   0  22.67  26113600.0  837180  18.27  1.55  
3  eAAPL  20265100.0   0  22.73  24884300.0  832945  18.18  1.56  
4  eAAPL  24494800.0   0  22.54  25008200.0  819360  17.88  1.59

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

csv

DataFrame

pandas dataframe读取csv，其中行末尾有/没有逗号的相关文章

从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
如何使用 php 将 *.xlsb 转换为数组或 *.csv

我正在尝试转换 xlsb文件到php array or csv文件或至少 xls 我尝试使用PHPExcel 但看起来它无法识别该文件中的内容我注意到你可以重命名 xlsb文件到 zip文件然后使用命令行解压缩unzip zip 之

随机推荐

Ruby 中的一行 if 语句

我有以下代码 if day gt 31 day 31 month April end 我可以把它写在一行中而不是 if day gt 31 then day 31 and month April end 我试过这样 if day gt 3
使用VideoJS播放器播放RTMP流

我正在尝试玩RTMP流式传输VideoJS玩家下面是我的代码
Wildfly 9 http 转 https

我想将请求从 HTTP 重定向到 HTTPS 我正在使用 Wildfly 9 经过谷歌搜索后我发现了以下内容但它不起作用我希望有人
如何在 Java 中将 BigInteger 值转换为十六进制

我正在制作一个Java程序我有一个 BigInteger 数字我需要将其转换为十六进制我尝试了以下代码 String dec null System out println Enter the value in Dec Buffere
更改特定数据的颜色

我想更改 json 文件中某些数据的颜色如果我有一个包含日期的数据集并且我想要 2017 年的日期为浅粉色我怎样才能在不影响2018年 2019年等的情况下实现这一目标日期 json文件 id 1 month 2017 03 01
大型 XML 文件和分页，可能吗？

问题当在您的计算机上本地打开非常大的 XML 文件时几乎可以肯定的是该文件需要一段时间才能打开这通常意味着您的计算机因认为没有响应而被锁定如果您为用户提供他们使用的相当复杂的数据库或系统的 XML 备份这就是一个问题他们能够打
WPF - 如何保存没有任何 Alpha 通道的 PNG？

我有一个BitmapSource 我将它保存为像这样的png PngBitmapEncoder enc new PngBitmapEncoder enc Frames Add myBitmapSource enc Save fs 如何在没有
C 中自动 stdout 缓冲区刷新的规则是什么？

我只是好奇应该满足哪些条件才能自动刷新标准输出缓冲区首先我很困惑这个伪代码不会在每次迭代时打印输出 while 1 printf Any text sleep 1 但如果我添加换行符它就会经过几次实验我发现在我的机器上标准输出缓冲
用 C++ 模拟 CPU 负载

我目前正在使用 C 在 Windows 中编写一个应用程序我想模拟 CPU 负载我有以下代码 void task1 void param unsigned elapsed 0 unsigned t0 while 1 if t0 cloc
批处理文件检查具有相同扩展名的文件

所以我不太擅长代码我有一个代码可以检查扩展名文件的大小 txt我需要它来验证具有该扩展名的所有文件如果大于限制则写入一个例如 size txt里面是超出大小限制的文件的名称我已经拥有并给我的代码是它没有写入文件的部分size
Spring Flux 和 Async 注解

我有一个 Spring Flux 应用程序在某些时候我需要在后台执行一些繁重的任务调用者 HTTP 请求不需要等到该任务完成如果没有反应堆我可能会使用Async https docs spring io spring framew
使用浮点数求级数总和

我计算了该系列的前 20 个元素有两种方式第一种向前第二种向后为此我做了 include
构造函数和 Pydantic

我想创建一个带有构造函数的 Pydantic 类该构造函数对输入进行一些数学运算并相应地设置对象变量 class PleaseCoorperate BaseModel self0 str next0 str def init self p
从 Java 输入流读取下一个字符（完整的 unicode 代码点）

我需要逐个字符地解析UTF 8输入来自文本文件按字符我指的是完整的UTF 8字符 UTF 8代码点而不是Java的字符我应该使用什么方法 There s CharSequence codePoints https docs orac
有没有办法“传播”或“扁平化”GraphQL 响应？

我有一个如下所示的 GraphQL 查询 allContentfulDocuments edges node documents id 有什么办法可以压平edges and node层变成基本上像这个查询一样工作的东西 allConten
多进程和子进程有什么区别？

我的工作应该使用并行技术并且我是Python的新用户我想知道你是否可以分享一些关于Python的材料multiprocessing and subprocess模块这两者有什么区别 The subprocess模块允许您运行和控制其他
是否存在完全“布局中立”的 HTML 容器元素？

有时我想在其他几个 HTML 元素周围放置一个包装元素带着唯一的目的设置一个方便的 CSS 选择器来引用所有包含的元素
获取 N 维 numpy 数组中第一次出现的值

我见过这个问题 https stackoverflow com questions 432112 is there a numpy function to return the first index of something in an
Tensorflow 因 CUBLAS_STATUS_ALLOC_FAILED 崩溃

我使用简单的 MINST 神经网络程序在 Windows 10 上运行 tensorflow gpu 当它尝试运行时它遇到了CUBLAS STATUS ALLOC FAILED错误谷歌搜索没有发现任何东西 I c tf jenkins
pandas dataframe读取csv，其中行末尾有/没有逗号

我的示例文件如下所示 1 50424e 09 164 84 164 94 163 4 164 07 09 30 00 1 50424e 12 eAAPL 1 38904e 07 0 22 45 2 64333e 07 847097 18 4

pandas dataframe读取csv，其中行末尾有/没有逗号

pandas dataframe读取csv，其中行末尾有/没有逗号 的相关文章

随机推荐

热门标签

pandas dataframe读取csv，其中行末尾有/没有逗号的相关文章