第四章. Pandas进阶—数据导出

2023-11-07

第四章. Pandas进阶

4.7 数据导出

1.导出.xlsx文件

1).语法:

DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None) 

参数说明:
excel_writer:xlsx文件所在路径
sheet_name:数据表的名称
na_rep:缺失数据的表示方法
float_format:格式化浮点数的字符串
encoding:指定Excel文件的编码格式

2).示例

  • 示例1:单个.xlsx文件的导出方式
import pandas as pd

pd.set_option('display.unicode.ambiguous_as_wide', True)  # 处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)  # 无法对齐主要是因为列标题是中文

df1 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet1')
print(df1)
print('*' * 50)

df2 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet2')
print(df2)
print('*' * 50)

df_merge = pd.merge(df1, df2)
print(df_merge)

# 导出一个Excel文件
df_merge.to_excel('F:\\Note\\图书采购清单汇总.xlsx',sheet_name='汇总')

结果展示:
在这里插入图片描述

  • 示例2:多个.xlsx文件的导出方式
import pandas as pd

pd.set_option('display.unicode.ambiguous_as_wide', True)  # 处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)  # 无法对齐主要是因为列标题是中文

df1 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet1')
print(df1)
print('*' * 50)

df2 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet2')
print(df2)
print('*' * 50)

df_merge = pd.merge(df1, df2)
print(df_merge)

#导出多个Excel文件
excel_Path='F:\\Note\\图书采购清单汇总.xlsx'
with pd.ExcelWriter(excel_Path) as writer:
    df1.to_excel(writer, sheet_name='df1')
    df2.to_excel(writer, sheet_name='df2')
    df_merge.to_excel(writer, sheet_name='汇总')
    

结果展示:
在这里插入图片描述

2.导出.csv文件

1).语法:

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict')

参数说明:
path_or_buf:csv文件所在路径
sep:分隔符,默认“ ,”
na_rep:缺失数据的表示方式
float_format:浮点数的输出格式
encoding:编码方式:utf-8(默认),gbk

2).示例

  • 示例1:相同字段的表首尾相连
import pandas as pd

pd.set_option('display.unicode.ambiguous_as_wide', True)  # 处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)  # 无法对齐主要是因为列标题是中文

df1 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet1')
print(df1)
print('*' * 50)

df2 = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet2')
print(df2)
print('*' * 50)

df_merge = pd.merge(df1, df2)
print(df_merge)

# 导出csv文件
df_merge.to_csv('F:\\Note\\图书采购清单汇总.csv', sep=',', float_format='%.2f', encoding='gbk')

结果展示:
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

第四章. Pandas进阶—数据导出 的相关文章

随机推荐

  • element-plus 一个vue3.xUI框架 (element-ui的3.x 版初体验)

    官方文档已更新 点击跳转 突然发现已经半年没更新的element ui更新了 更新了什么还不清楚 但是告知了基于vue3 x版本的 element plus 已经出来了 先来上手体验一下 首先安装一个最新的 vue cli 搭建一个vue3
  • 群晖 使用SMB3进行局域网传输双倍叠加网速下踩的一些坑

    我用的是黑群晖 版本DSM6 2 3 展示成功叠加 原本速度在110左右 网上已经有很多群晖如何双倍叠加的类似的教程 我在这里就不详解了 参考前人写的教程即可 群晖 群晖开启 SMB3 windows下多通道叠加网卡速度 Vedio Tal
  • 某高校毕业设计-数据分析课题技术实现篇

    文章目录 某高校毕业设计 数据分析课题技术实现篇 1 确定分析目标 2 初步判断数据研判数据 2 1能不能找到数据 gt 可以找到 2 2分析指标 2 2 1 指标1 各个老师的毕设通过率 2 2 2 指标2 每年的毕设重修人数 2 2 3
  • java8新特性Stream流中anyMatch和allMatch和noneMatch的使用!!!

    1 anyMatch 判断数据列表中是否存在任意一个元素符合设置的predicate条件 如果是就返回true 否则返回false 接口定义 boolean anyMatch Predicate
  • iOS开发者帐号申请指南

    iOS开发者的申请流程 如果你是一个开发团队 在你打算掏腰包购买iOS开发者授权之前 最好先问一下你的同事 是否已经有人获得了开发许可 因为一个开发许可一年内最多可以授权给111个设备来开发测试 如果你没有授权许可可以借用 或者你打算最终在
  • JavaScript基础之生成随机颜色

    html 用于显示颜色 div style width 200px height 200px div JS function getcolor 获取随机色 ffffff格式 let sljz 0 1 2 3 4 5 6 7 8 9 a b
  • 【Zabbix实战之部署篇】docker部署Zabbix+grafana监控平台

    Zabbix实战之部署篇 docker部署Zabbix grafana监控平台 一 Zabbix介绍 1 Zabbix简介 2 Zabbix的优点 3 Zabbix各组件介绍 4 Zabbix架构图 二 grafana介绍 1 grafan
  • plc梯形图100实例详解_干货

    今天给大家分享的是关于PLC编程控制入门常用到的实例 里面包含的知识点是较为齐全的 如 I O分配表 PLC接线图 梯形图程序等 一 电动机顺序启动 顺序停止控制 I O分配表 PLC接线图 梯形图程序 二 电动机的顺序启动 同时停止 I
  • windows家庭版本使用远程桌面

    windows家庭版是不支持远程桌面的 开源软件RDP Wrapper可以帮助家庭版也支持远程桌面的功能 Github项目地址 安装步骤 1 右键管理员运行install bat 2 右键管理员运行RDPConf exe 问题解决 1 se
  • 实体类监听器EntityListeners

    自定义实体类监听器类 public class DataBaseAuditListener PrePersist public void prePersist Object object throws IllegalArgumentExce
  • 两个栈实现一个队列(图解),一看就懂

    两个栈实现一个队列 要想实现此方法 我们现需要了解一下什么是栈和队列 栈 栈 Stack是一种只能在一端进行插入或删除操作的线性表 表中允许进行插入 删除操作的一端称为栈顶 Top 栈顶的当前位置是动态的 栈顶的当前位置是由一个称为栈顶指针
  • Windows+Ubuntu18.04双系统安装【完美版】

    经常卸载Ubuntu导致了卸载完后必须重装 我安装的Ubuntu版本是18 04 镜像下载链接Ubuntu 18 04 6 LTS Bionic Beaver 1 制作系统安装盘 1 1 安装并打开软碟通 插上 U 盘 并且最好备份你的 U
  • vue2 学习之路 常见的指令!

    文件夹 和 文件夹含义 主要的文件及其含义 node modules 下载的第三方包 安装目录 public index html 浏览器运行的网页 src main js webpack打包的入口文件 src App vue vue项目入
  • AndroidStudio设置代码自动提示以及字体大小设置

    我的Studio版本是3 14是按照我版本设置的 一 设置字体大小 File gt Settings gt Editor gt font gt size 如下图示 二 设置代码提示 File gt Settings gt General g
  • php对二维数组的某个值进行排序

    需求按type sum的大小来排序 array 5 0 gt string 1 1 1 gt string 1 2 2 gt string 1 2 3 gt string 1 2 4 gt string 1 3 最终结果 array 5 0
  • Error code of Media server (MediaPlayer内核异常码说明)

    Error code of Media server HRESULT Description 0x000D0000 The requested operation is pending completion 0 0x000D0001 The
  • Go_数据类型(值传递&引用传递)

    数据类型 计算机存储设备最小信息单位是位 bit 最小的存储单元是字节 byte 占用字节的不同 所表示能存储的数据长度不同 数据类型用来说明数据的数据的结构 便于定义变量 参数传递等 数据类型默认值 类型 默认值 整型 0 浮点型 0 0
  • SpringBoot后端接受前端传递对象参数

    SpringBoot后端接受前端传递对象参数 最近用到SpringBoot前端传递参数给后端踩得一些坑分享给大家 代码 类 Data public class ArticleVo JsonProperty value name privat
  • Burp Suite抓不到本地包/localhost包问题解决汇总

    一 火狐配置好IP和安装后BP的证书 1 首先在火狐浏览器中配置好本地IP选项 2 配置好后访问http burp 下载安装证书先点击右上角下载证书 3 下载好后双击运行 安装证书 二 尝试使用本地IP域名 我们将地址栏的localhost
  • 第四章. Pandas进阶—数据导出

    第四章 Pandas进阶 4 7 数据导出 1 导出 xlsx文件 1 语法 DataFrame to excel excel writer sheet name Sheet1 na rep float format None column