python读取20万数据Excel文件+拆分数据

2023-11-08

python读取20万数据Excel文件

使用普通的pandas读取Excel,再结合xlrd读取,可能会读取的Excel数据会不全,最多只能读取到65535+行的数,如果读取超大excel数据时就读取不了。
解决读取数据不全python代码。

#!/usr/bin/python3.6
# -*- coding: utf-8 -*-
# @Time    : 2022/9/30 8:49
# @Author  : Admin
# @Email   : xxxxxxxxxxx@xxx.com
# @Phone   : 199xx08xxxx/191xx93xxxx
# @File    : 拆分.py
# @Software: PyCharm
import pandas as pd
import time
import datetime

start = time.clock()
print('程序正在运行, 请稍等...')
print("数据读取中...")
today_now = datetime.datetime.now()
print("现在时间是:", today_now)

data = pd.read_excel("汇总:小区编码与名称对应列表-截至20220928-new.xlsx", sheet_name="Sheet1", engine='openpyxl')
print(data)
print(data.info())

rows = data.shape[0]  # 获取行数 shape[1]获取列数
department_list = []

for i in range(rows):
    temp = data["地市"][i]
    if temp not in department_list:
        department_list.append(temp)  # 将销售部门的分类存在一个列表中

for department in department_list:
    new_df = pd.DataFrame()

    for i in range(0, rows):
        if data["地市"][i] == department:
            new_df = pd.concat([new_df, data.iloc[[i], :]], axis=0, ignore_index=True)

    new_df.to_excel(str(department) + ".xlsx", sheet_name=department, index=False)  # 将每个销售部门存成一个新excel

print("分表成功")
print("成功!")
today_now_end = datetime.datetime.now()
print("现在时间是:", today_now_end)
end = time.clock()
print('本次耗时:%0.0f秒' % (end - start))

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python读取20万数据Excel文件+拆分数据 的相关文章

随机推荐

  • java基础系列 -- 类的三大特性:封装、继承、多态

    java类的特性 类有三大特性 封装 继承 多态 封装 封装就是将类的某些属性隐藏起来 限制在类的外部对类内部成员进行访问 通过接口对外开放 但是在外部不能直接进行查找属性 只通过公共接口来访问类的成员数据 为什么要设置隐藏 隐藏数据是为了
  • jpa.hibernate.ddl-auto属性说明

    jpa hibernate ddl auto 的几个常用属性值 none 默认值 什么都不做 每次启动项目 不会对数据库进行任何验证和操作 create 每次运行项目 没有表会新建表 如果表内有数据会被清空 create drop 每次程序
  • nginx_http_proxy,upstream,stream模块简析

    一 ngx http proxy module模块 模块功能 为后端httpd服务做反向代理 并且与Httpd 之间使用http进行通信 1 proxy pass URL Context location if in location li
  • 如何求C语言字符串长度(strlen函数和sizeof关键字)

    如何求C语言字符串长度 strlen函数和sizeof关键字 在程序里 一般会用 strlen 函数或 sizeof 来获取一个字符串的长度 但这2种方法获取的字符串的长度其实是不一样 我们用如下函数进行测试 void test6 char
  • Java8新特性-Lambda表达式

    Lambda表达式 也可称为闭包 它是推动Java8发布的最重要的特性 Lambda允许把函数作为一个方法的参数 函数作为参数传递进入方法中去 使用lambda表达式可以把代码变得更加简洁紧凑 语法 lambda表达式的语法格式如下 par
  • Ciclop开源3D扫描仪软件---Horus源码分析之point_cloud_roi.py

    联系方式 QQ 2468851091 call 18163325140 Email 2468851091 qq com coding utf 8
  • C语言小游戏——井字棋(数组实现)

    学c也学了有一些时间了 今天用c语言做了一个小游戏 井字棋 相信大家也玩过 我们这个游戏的思路呢 是玩家和电脑对弈 谁先把三颗棋子连成一条线 谁就赢了 如下图所示 要想实现我们这个井字棋需要用到数组的知识 所以 老规矩我们先简单的把数组讲一
  • SCI审稿流程(转)

    1 收到邮件 编辑约审稿 同意就接受 会约定审稿期限 一般三个月 Dear Mr Cat Please be informed you have been registered by our editorial team as a user
  • scheduler学习率设置

    在炼丹的过程中 学习率的调整是必不可少的 下面给出scheduler模块的调学习率的方法 后面会慢慢补充 调整学习率 PyTorch官方文档 一 CyclicLR torch optim lr scheduler CyclicLR opti
  • php把二维数组变为一维,如何将PHP二维数组转换为一维数组

    如何将PHP二维数组转换为一维数组 发布时间 2020 07 22 11 12 05 来源 亿速云 阅读 137 作者 Leah 如何将PHP二维数组转换为一维数组 相信很多没有经验的人对此束手无策 为此本文总结了问题出现的原因和解决方法
  • 网络协议详解:TCP Part1

    目录 TCP的可靠性 TCP的机制 ack 编号机制 1 发送的数据编号 SN 2 确认的数据编号 ASN 3 编号规则 4 SN在发送TCP Segment 的 Header 中如何体现 5 ASN的填写规则 6 ISN TCP segm
  • 2.4.3 分区状态

    最后更新2021 07 17 No Active 分区处于非活动状态 在此状态 分区仅存在Profile的定义 可以有多个Profile定义 但都没有激活 而不占据任何系统资源 SMS服务模式状态 分区启动经过自检后将会根据Profile的
  • 香港爱情电影二十四经

    香港爱情电影二十四经之第一经 寻找 飞一般爱情小说 叶锦鸿1997 我们不是在寻找 我们只是在给邂逅一个机会 叶锦鸿的这部电影清新温暖 恬淡动人 一幅如流水般的爱情图画 三个青年相约一块寻找一个女孩 然后确定爱情的归属 谁都知道 这不是爱情
  • Vue路由基础部分,Vue路由基础知识

    Vue路由基础部分 Vue路由基础知识 1 介绍 2 基础 1 起步 2 动态路由匹配 3 嵌套路由 4 编程式的导航 5 命名路由 6 命名视图 7 重定向和别名 1 介绍 Vue Router 是 Vue js 官方的路由管理器 它由V
  • Chrome浏览器不能同步书签的解决方法

    问题现象 在Chrome浏览器登陆同步书签的时候 提示报错 解决方法 需要 使用Chrome访问助手 操作步骤 下载Chrome访问助手 https www ggfwzs com 下载后进行解压 然后依次点击如下操作 把刚才解压的 crx直
  • Microsoft Office 2007的安装

    哈喽 大家好 今天一起学习的是office2007的安装 有兴趣的小伙伴也可以来一起试试手 一 测试演示参数 演示操作系统 Windows 7 不建议win10及以上操作系统使用 系统类型 64位 演示版本 cn office ultima
  • opencv进阶学习笔记12:轮廓发现和对象测量

    基础版笔记目录 python3 opencv学习笔记汇总目录 适合基础入门学习 进阶版笔记目录链接 python opencv进阶版学习笔记目录 适合有一定基础 轮廓发现 1轮廓发现介绍 基础版讲解 opencv学习笔记20 图像轮廓 2轮
  • 控制符号的可见性

    在普通的C语言中 如果您希望将函数或者变量限制在当前文件中 需要对其使用static关键字 然而 在一个包含很多文件的共享库中 如果您希望某个符号可以被共享库内部的几个文件访问 而又不提供给外部 则对符号进行隐藏处理就会比较困难 大多数的连
  • 网络重连封装

    网络重连 部分情况会遇到业务接口失败 但我们又不希望让用户去退出应用重启 这时候我们可以在网络层设置一个重连机制 写这个的时候我想到了当时实现token无痛刷新时没有去解决的一个痛点 但我去刷新token的时候如果是获取令牌的接口报错那程序
  • python读取20万数据Excel文件+拆分数据

    python读取20万数据Excel文件 使用普通的pandas读取Excel 再结合xlrd读取 可能会读取的Excel数据会不全 最多只能读取到65535 行的数 如果读取超大excel数据时就读取不了 解决读取数据不全python代码