【Pandas学习】读、存excel数据

2023-11-07

一、读数据

二、将df存为excel

1、pandas.DataFrame.to_csv() 函数语法

2、利用 import os 获取保存路径

3、产生新的数据，添加至上述csv文件中已有数据的后面

4、多sheet，指定存入的sheet

5、df.to_csv()出现中文乱码的解决办法

一、读数据

sep：默认以逗号分隔

header：是否包含表头

df = pd.read_csv('data.csv', sep='\t',header=None, names=['var_code','var_name','var_desc'])

二、将df存为excel

1、pandas.DataFrame.to_csv() 函数语法

pandas.DataFrame.to_csv(path_or_buf= None,
                 sep= ",",
                 na_rep= "",
                 float_format= None,
                 columns= None,
                 header= True,
                 index= True,
                 index_label= None,
                 mode= "w",
                 encoding= None,
                 compression= "infer",
                 quoting= None,
                 quotechar= '""',
                 line_terminator= None,
                 chunksize= None,
                 date_format= None,
                 doublequote= True,
                 escapechar= None,
                 decimal= ".")

是否加表头和行索引

index_A = df[df[0] == "<!AAA>"].index.tolist()
df_A = df.iloc[index_A[0]+1:index_A[1], ]
print('索引', index_A)
print(df_A)
df_A.to_csv('AAA.csv', header=False, index=False, encoding='utf-8-sig')

默认情况下保存文件会保存到和当前执行的文件相同的文件夹中

a=np.random.random(100)
a=a.reshape(25,4)
a=pd.DataFrame(a)
a.to_csv('G:\\0py\\result\\a.csv')

注意，路径一定要用双斜杠，用单斜杠会报错，原因未知

2、利用 import os 获取保存路径

import os    #获取当前工作路径
import pandas as pd   #将数据保存至相应文件中

file = os.getcwd() + '\\1.csv'    #保存文件位置，即当前工作路径下的csv文件
data = pd.DataFrame({'a':[1, 2, 3], 'b': [4, 5, 6]})  #要保存的数据
data.to_csv(file, index=False)   #数据写入，index=False表示不加索引

3、产生新的数据，添加至上述csv文件中已有数据的后面

#新数据，与data具有相同的和列与列名
data2 = pd.DataFrame({'a':[7, 8, 9], 'b': [1, 2, 3]})
#保存至file文件中，index=False表示文件中不添加索引，header=False表示不添加列名，mode='a+'表示在已有数据基础上添加新数据，并不覆盖已有数据
data2.to_csv(file, index=False, mode='a+', header=False)

4、多sheet，指定存入的sheet

直接用pd.to_excel()指定sheet_name时，即使指定sheet_name也没用，后一次的写入数据会覆盖前一次写入的数据，解决方法如下，借助pandas中的ExcelWriter方法；

 1 # 方法1，推荐方法
 2 with pd.ExcelWriter('test.xlsx') as writer:
 3     data.to_excel(writer, sheet_name='data')
 4     data2.to_excel(writer, sheet_name='data2')
 5 
 6 # 写法2
 7 writer = pd.ExcelWriter('test.xlsx')
 8 data.to_excel(writer, sheet_name='data')
 9 data.to_excel(writer, sheet_name='data2')
10 writer.save()
11 writer.close()

5、df.to_csv()出现中文乱码的解决办法

解决办法：只需在后面加上 encoding='utf_8_sig'

df.to_csv('F:\\test\\688019.csv', index=False, encoding='utf_8_sig')

     'utf-8' 和 'utf_8_sig' 的区别：
    ”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,因此它不需要BOM,所以当用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理。
    "uft-8-sig"中sig全拼为 signature 也就是"带有签名的utf-8", 因此"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python 学习笔记

pandas

学习

python

【Pandas学习】读、存excel数据的相关文章

如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
Python 2：SMTPServerDisconnected：连接意外关闭

我在用 Python 发送电子邮件时遇到一个小问题 me my email address you recipient s email address me email protected cdn cgi l email protectio
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

Mysql解决of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column问题

一查询语句查询语句一 select count u id from user u LEFT JOIN dept d on u dept id d id LEFT JOIN user role ur on u account ur acc
本地硬盘安装 Linux RedHat Linux 9.0

我准备在自己已装有windows xp 的机器上LINUX 用来学习一下由于光驱和光盘的问题整了一下午加一晚上都没整上来还废了我几张光盘每次上天保佑好不容易第一张盘顺利读完了刚刚得意的时候第二张盘又不动了气死我了第二天找了
如何从“豌豆荚”下载APP的历史版本？

如何下载该app的历史版本呢下面我就以抖音极速版为例教大家如何从豌豆荚下载抖音极速版app 的历史版本豌豆荚官网 https www wandoujia com 教程步骤 1 打开上述豌豆荚官网在搜索框输入抖音极速版点
koa（express升级版框架）的基本使用

前端项目实习笔记 1 引言 2 各种源的由来 3 koa使用教程 3 1koa基本使用以及洋葱模型 3 2koa路由的使用 3 3koa常用的内置模块 3 4koa配置静态资源目录 3 5koa连接mongoDB数据库 1 引言今天拿着代
【Java基础】注释

注释书写注释是一个非常好的习惯 Java中的注释单行注释语法输入在后面加上注释的内容例 System out println Hello World 输出语句 Hello World 多行注释语法注释内容结尾文档注释语
python开发推荐命名规范

python中的推荐命名规范参考Google开源风格 python代码中需要命名的主要包括包模块类函数变量常量 python之父Guido推荐的命名方法如下类型说明示例包小写下划线 my package 模块小写下
MySQL之[42000][1055] Expression #1 of SELECT list is not in GROUP BY clause问题

问题提出 MySQL数据表查询语句 select from t user where sex 0 group by home address having count id gt 0 提示如下错误信息 42000 1055 Expressi
打开Adobe Premiere Pro提示“由于找不到msvcp110.dll，无法继续执行代码。重新安装程序可能会解决此问题”。【方法适用于几乎所有dll文件丢失时】

打开Adobe Premiere Pro提示由于找不到msvcp110 dll 无法继续执行代码重新安装程序可能会解决此问题网上之前找了一堆解决办法都没用最后终于使用工具解决了分享给大家参考简单来讲就是系统C Windows
main.c(16): warning: #223-D: function "led_init" declared implicitly

编写了一个简单的stm32 的程序比如led h和led c 在led c中定义了函数 void led init void 在main 函数中用的led init 除了要包含led h外需要声明下函数才可以 extern void l
Linux开机自启动挂盘以及进入紧急模式的解决办法

设置开机自启动挂盘经常会有挂载错误的操作然后就进入了紧急模式这俩孩子老是一起出现就一起解决了吧 1 dev sr0已经挂载好了现在需要把它重新挂载到另一个目录 media cdrom下 2 如果需要把它挂载到另一个目录 media
【华为OD机试】找出两个整数数组中同时出现的整数(C++ Python Java)2023 B卷

时间限制 C C 1秒其他语言 2秒空间限制 C C 262144K 其他语言524288K 64bit IO Format lld 题目描述现有两个整数数组需要你找出两个数组中同时出现的整数并按照如下要求输出有同时出现的整数时
上传文件——FormData的格式

let fd new FormData fd append file params file 上传文件时上传fd即可使用场景一般是异步上传文件需要formdata的形式表单元素的集合减少元素的拼接提高效率
第 19 课时：调度器的调度流程和算法介绍（木苏）

本文将主要分享以下四个部分的内容调度流程调度算法如何配置调度器如何扩展调度器调度流程调度流程概览首先来看一下调度器流程概览图调度器启动时会通过配置文件 File 或者是命令行参数或者是配置好的 ConfigMap 来指定调
安卓7.0 在加载某些https资源的时会出现证书验证错误OS Error(handshake.cc:)解决方案

今天收到反馈 Flutter库 CachedNetworkImage 3 2 3 在华为早期安卓版本7 0系统中加载某些https网站的图像时会出现类似这样的错误 I flutter The following HandshakeExcep
生成静态页面的五种方案收藏

方案1 public static bool WriteFile string strText string strContent string strAuthor string path HttpContext Current Serve
【知识图谱】知识图谱数据库将人类的思维路径转化为机器的路径思维

前段时间被沙特阿拉伯授予公民身份的人形机器人索菲亚再一次颠覆了人们对人工智能技术的认知索菲亚多次与人类交锋并公开发表言论的过程中我们感受到了基本的对答如流有时甚至还可以做到妙语连珠据了解索菲亚的大脑存储在云端通过连接WIF
处理处理kdevtmpfsi挖矿病毒以及他的守护进程kinsing

服务器CPU资源占用一直处于100 的状态检查发现是kdevtmpfsi占用导致的此进程为挖矿程序处理步骤如下 kdevtmpfsi 进程处理 1 top 查看cpu占用情况找到占用cpu的进程最后是 kdevtmpfsi 2 n
将文件间的编译依存关系降至最低——条款31

假设你对C 程序的某个class实现文件做了些轻微修改注意修改的不是class接口而是实现而且只改private成分然后重新建置这个程序并预计只花数秒就好毕竟只有一个class被修改你按下 Build 按钮或键入make 或
西门子200SMART（六）数据块

数据块中的数据页可以插入编辑删除查询和之前讨论的程序块符号快以及状态图标基本具备一样的功能数据块最主要点作用就是对地址和数据赋值如下图这里需要注意点是这里的赋值和之前我们说过的状态图表中的强制是有区别的强制顾名思义不管你
【Pandas学习】读、存excel数据

目录一读数据二将df存为excel 1 pandas DataFrame to csv 函数语法 2 利用 import os 获取保存路径 3 产生新的数据添加至上述csv文件中已有数据的后面 4 多sheet 指定存入的she

【Pandas学习】读、存excel数据

一、读数据

二、将df存为excel

2、利用 import os 获取保存路径

3、产生新的数据，添加至上述csv文件中已有数据的后面

4、多sheet，指定存入的sheet

5、df.to_csv()出现中文乱码的解决办法

【Pandas学习】读、存excel数据 的相关文章

随机推荐

热门标签

【Pandas学习】读、存excel数据的相关文章