Pandas 中的 read_excel() 读取 excel 数据详细参数用法

2023-11-03

前言:read_excel() 参数说明

pandas 中读取 excel 数据的:pd.read_excel()

pandas.read_excel(
        io,
        sheet_name=0,
        header=0,
        names=None,
        index_col=None,
        usecols=None,
        squeeze=False,
        dtype=None,
        engine=None,
        converters=None,
        true_values=None,
        false_values=None,
        skiprows=None,
        nrows=None,
        na_values=None,
        keep_default_na=True,
        verbose=False,
        parse_dates=False,
        date_parser=None,
        thousands=None,
        comment=None,
        skipfooter=0,
        convert_float=True,
        mangle_dupe_cols=True,
        **kwds
)

以下表作为案例,表名为:学习率图形.xlsx

1. 基本用法(io)

直接使用 pd.read_excel(r"文件路径"),默认读取第一个 sheet 的全部数据

实际上就是第一个参数:io,支持 str, bytes, ExcelFile, xlrd.Book, path object, or file-like object

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx')

print(data)

2. sheet_name(str, int, list, None, default 0)

str 字符串用于引用的 sheet 的名称

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', sheet_name='second')

print(data)

int 整数用于引用的sheet的索引(0开始)

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', sheet_name=1)

print(data)

字符串或整数组成的列表用于引用特定的 sheet

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', sheet_name=[0, 'second'])

print(data)

3. header(int, list of int, default 0)

表示用第几行作为表头,默认 header=0,即默认第一行为表头

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx',header=0)

print(data.head())

hearder=[1,2,3]:选择第 2,3,4 行的数据作为表头

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx',header=[1,2,3])

print(data.head())

header=None:表示不使用数据源中的表头

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx',header=None)

print(data.head())

4.names(array-like, default None)

表示自定义表头的名称,需要传递数组参数

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', sheet_name=1, names=['algorithm'])

print(data.head())

5. index_col(int, list of int, default None)

指定列为索引列,默认为 None,也就是索引为 0 的列用作 DataFrame 的行标签

6. usecols(int, str, list-like, or callable default None)

  • 默认为 None,解析所有列
  • 如果为 str,则表示 Excel 列字母和列范围的逗号分隔列表(例如 "A:E""A, C, E:F"'A:B,D:G'), 范围全闭
  • 如果为 int,则表示解析到第几列。
  • 如果为 int 列表,则表示解析那几列。

str:usecols="A:C", 只读取从 A 列到 C 列的数据

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', usecols="A:C")

print(data.head())

int:usecols=3, 表示解析第 0,1,2,3 列,共 4

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', usecols=3)

print(data.head())

int of list:usecols=[0,1,4],表示解析第 1 列,第 2 列,第 5 列的数据

import pandas as pd

data = pd.read_excel(r'学习率图形.xlsx', usecols=[0,1,4])

print(data.head())

注: 当 header 为多行组成的表头时,使用 usecols 会爆如下错误:

ValueError: cannot specify usecols when specifying a multi-index header

7. squeeze(bool, default False)

默认为 False。如果设置 squeeze=True 则表示如果解析的数据只包含一列,则返回一个 Series。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 中的 read_excel() 读取 excel 数据详细参数用法 的相关文章

随机推荐

  • 定位及优化SQL语句的性能问题

    一 EXPLAIN 做MySQL优化 我们要善用 EXPLAIN 查看SQL执行计划 下面来个简单的示例 标注 1 2 3 4 5 我们要重点关注的数据 type列 连接类型 一个好的sql语句至少要达到range级别 杜绝出现all级别
  • 海思Hi3536使用QOpenGLWidget预览yuv420sp视频

    参考文章 ffmpeg opengl 硬解视频并使用opengl在qt中显示nv12 qt 使用opengl显示yuv实时视频流 上述参考文章中 qt 使用opengl显示yuv实时视频流 主要是介绍yuv420p存储方式的openGL渲染
  • 网页的基本信息

  • springboot2.6.4整合elasticsearch7.15.2

    之前跟着老师的视频安装了一个es6 4 3 视频里说 6 gt 7 类型逐渐被废弃 版本变化较大 与springboot不兼容 建议安装6 4 3与内部一致 我就很天真的跟着一块装了 结果可想而知 我的springboot版本是2 6 4啊
  • chrome linux arm64,谷歌浏览器为何还没发布ARM64原生版?高通表示非技术而是政策问题...

    高通与微软合作的Windows 10 ARM 设备目前发展并不顺利 尽管愿景很美好但愿购买此类设备的用户并不多 用户不愿意购买的原因其实有多种 但是可能最大的问题就是此类设备的兼容性并没有传统笔记本电脑的那么好 例如传统桌面软件理论上说是不
  • 手把手教你手工焊接贴片元件(图文教程)

    一 贴片电容 1 首先来张全部焊接一个点的PCB图 2 当然这是焊接贴片的必须工具 3 这个是准备焊接的DD 晕倒 稍不小心会不见 4 夹一个的姿势 6 先用烙铁加热焊点 7 然后夹个贴片马上过去 8 等贴片固定后焊接另外一边 二 M290
  • sql从查询结果创建一个临时表

    从查询结果创建一个临时表 临时表随数据库的关闭而自动消失 不占内存空间 创建临时表的方法与创建永久表的方法相似 只不过在新表的名称前加一个 号或两个 号 一个 号表示创建的是局部的临时表 两个 号表示创建的是全局临时表 示例 在 cours
  • 调用模板类出现 undefined reference 错误的解决方法

    g 不支持模板类的分离编译 因此模板的实现最好都些在 h文件中 否则将出现undefined reference to XXXX 的错误 下面是一个出错的例子 解决方法就是将stack cc中的代码移到stack h中 01 02 03 i
  • 【前端】WeUI DatePicker时间组件绑定方法以及chatGPT回答

    2023年 第33周 第1篇文章 给自己一个目标 然后坚持总会有收货 不信你试试 WeUI DatePicker 这个组件在纯html静态文件js里用的比较少 也忘记默认绑定值怎么设置 就用chatGPT来找答案 结果发现 chatGPT在
  • nsga2多目标优化之核心知识点(快速非支配排序、拥挤距离、精英选择策略)详解(python实现)

    文章目录 一 多目标优化算法简介 1 基本知识 二 NSGA2算法 1 基本原理 2 快速非支配排序 2 1快速非支配排序 python实现 3 拥挤距离 3 1 拥挤距离python 实现 4 精英选择策略 4 1 精英选择策略pytho
  • 安装系统时出现 Windows无法打开所需的文件 C:\Sources\install.wim 的解决办法

    使用U盘安装Win10的时候 出现 Windows无法打开所需的文件 C Sources install wim 错误代码 0x8007000D 这是由于启动盘里 install wim 文件不正确造成的 新Win10 镜像文件一般都大于4
  • MySQL数据库应用(8)DML语句之insert知识

    一 往表中插入数据 1 命令语法 insert into lt 表名 gt lt 字段名1 gt lt 字段名n gt values 值1 值n 2 新建一个简单的测试表test create table test id int 4 not
  • linux 源码包mysql,linux 下 mysql源码包的安装--

    linux 下 mysql源码包的安装 9页 本资源提供全文预览 点击全文预览即可全文预览 如果喜欢文档就下载吧 查找使用更方便哦 9 9 积分 linux 下 MySQL源码包的安装 gt gt linux 下 MySQL源码包的安装 实
  • 电路基础学习笔记2:LRC振荡电路

    LRC振荡电路 1 概述 LRC 振荡电路是一种基本的振荡电路 由电感L 电容C 电阻R组成 可以产生稳定的交流电信号 在LRC振荡电路中 电感和电容通过共振的方式相互作用 导致电荷周期性地从电容器到电感器和反向流动 从而产生周期性的电流和
  • 制作瀑布

    使用的瀑布模型 瀑布模型使用的材质 Demo WaterFall mat Demo WaterFall shadergraph 最终效果
  • python3(七)os模块

    os模块 OS模块简单的来说它是一个Python的系统编程的操作模块 可以处理文件和目录这些我们日常手动需要做的操作 可以查看OS模块的帮助文档 import os 导入os模块 help os 查看os模块帮助文档 里面详细的模块相关函数
  • if判断条件的优化写法

    优化后可读性 可维护性更好了 if分支越多 体现越明显 文章目录 优化前 简单判断 优化 简单判断 优化前 复杂判断 优化 复杂判断 优化前 简单判断 function getUserDescribe name if name 小刘 con
  • 区块链运行机制简介

    区块链简介 区块链技术是构建比特币区块链网路与交易信息加密传输的基础技术 其解决的核心问题是如何在缺少可信任中央节点和可信任通道的情况下 分布在网络中的节点如何达成共识 区块链被定义为一个分布式的账本 即每个区块链的节点都拥有系统所有交易的
  • 信令服务器接收到状态码,在蜂窝通信网络中请求连接的方法和设备专利_专利查询 - 天眼查...

    1 一种包含转换器服务逻辑模块0 的网络部件045 所述转换器服务逻辑模块 255 被安排成在操作上分别 经由第一通信链路075 与通信接入点 270 耦接 经由第二通信链路与自动配置服务器ACS逻辑模块 MO 耦接 以及经由第三通信链路与
  • Pandas 中的 read_excel() 读取 excel 数据详细参数用法

    前言 read excel 参数说明 pandas 中读取 excel 数据的 pd read excel pandas read excel io sheet name 0 header 0 names None index col No