python读取20万数据Excel文件+拆分数据

2023-11-08

python读取20万数据Excel文件

使用普通的pandas读取Excel，再结合xlrd读取，可能会读取的Excel数据会不全，最多只能读取到65535+行的数，如果读取超大excel数据时就读取不了。
解决读取数据不全python代码。

#!/usr/bin/python3.6
# -*- coding: utf-8 -*-
# @Time    : 2022/9/30 8:49
# @Author  : Admin
# @Email   : xxxxxxxxxxx@xxx.com
# @Phone   : 199xx08xxxx/191xx93xxxx
# @File    : 拆分.py
# @Software: PyCharm
import pandas as pd
import time
import datetime

start = time.clock()
print('程序正在运行, 请稍等...')
print("数据读取中...")
today_now = datetime.datetime.now()
print("现在时间是：", today_now)

data = pd.read_excel("汇总：小区编码与名称对应列表-截至20220928-new.xlsx", sheet_name="Sheet1", engine='openpyxl')
print(data)
print(data.info())

rows = data.shape[0]  # 获取行数 shape[1]获取列数
department_list = []

for i in range(rows):
    temp = data["地市"][i]
    if temp not in department_list:
        department_list.append(temp)  # 将销售部门的分类存在一个列表中

for department in department_list:
    new_df = pd.DataFrame()

    for i in range(0, rows):
        if data["地市"][i] == department:
            new_df = pd.concat([new_df, data.iloc[[i], :]], axis=0, ignore_index=True)

    new_df.to_excel(str(department) + ".xlsx", sheet_name=department, index=False)  # 将每个销售部门存成一个新excel

print("分表成功")
print("成功！")
today_now_end = datetime.datetime.now()
print("现在时间是：", today_now_end)
end = time.clock()
print('本次耗时:%0.0f秒' % (end - start))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python与excel公式

pandas

开发语言

python读取20万数据Excel文件+拆分数据的相关文章

Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
具有屏蔽无效值的 pcolormesh

我试图将一维数组绘制为 pcolormesh 因此颜色沿 x 轴变化但每个 x 的 y 轴保持不变但我的数据有一些错误值因此我使用屏蔽数组和自定义颜色图其中屏蔽值设置为蓝色 import numpy as np import mat
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如

随机推荐

java基础系列 -- 类的三大特性：封装、继承、多态

java类的特性类有三大特性封装继承多态封装封装就是将类的某些属性隐藏起来限制在类的外部对类内部成员进行访问通过接口对外开放但是在外部不能直接进行查找属性只通过公共接口来访问类的成员数据为什么要设置隐藏隐藏数据是为了
jpa.hibernate.ddl-auto属性说明

jpa hibernate ddl auto 的几个常用属性值 none 默认值什么都不做每次启动项目不会对数据库进行任何验证和操作 create 每次运行项目没有表会新建表如果表内有数据会被清空 create drop 每次程序
nginx_http_proxy,upstream,stream模块简析

一 ngx http proxy module模块模块功能为后端httpd服务做反向代理并且与Httpd 之间使用http进行通信 1 proxy pass URL Context location if in location li
如何求C语言字符串长度（strlen函数和sizeof关键字）

如何求C语言字符串长度 strlen函数和sizeof关键字在程序里一般会用 strlen 函数或 sizeof 来获取一个字符串的长度但这2种方法获取的字符串的长度其实是不一样我们用如下函数进行测试 void test6 char
Java8新特性-Lambda表达式

Lambda表达式也可称为闭包它是推动Java8发布的最重要的特性 Lambda允许把函数作为一个方法的参数函数作为参数传递进入方法中去使用lambda表达式可以把代码变得更加简洁紧凑语法 lambda表达式的语法格式如下 par
Ciclop开源3D扫描仪软件---Horus源码分析之point_cloud_roi.py

联系方式 QQ 2468851091 call 18163325140 Email 2468851091 qq com coding utf 8
C语言小游戏——井字棋（数组实现）

学c也学了有一些时间了今天用c语言做了一个小游戏井字棋相信大家也玩过我们这个游戏的思路呢是玩家和电脑对弈谁先把三颗棋子连成一条线谁就赢了如下图所示要想实现我们这个井字棋需要用到数组的知识所以老规矩我们先简单的把数组讲一
SCI审稿流程（转）

1 收到邮件编辑约审稿同意就接受会约定审稿期限一般三个月 Dear Mr Cat Please be informed you have been registered by our editorial team as a user
scheduler学习率设置

在炼丹的过程中学习率的调整是必不可少的下面给出scheduler模块的调学习率的方法后面会慢慢补充调整学习率 PyTorch官方文档一 CyclicLR torch optim lr scheduler CyclicLR opti
php把二维数组变为一维,如何将PHP二维数组转换为一维数组

如何将PHP二维数组转换为一维数组发布时间 2020 07 22 11 12 05 来源亿速云阅读 137 作者 Leah 如何将PHP二维数组转换为一维数组相信很多没有经验的人对此束手无策为此本文总结了问题出现的原因和解决方法
网络协议详解：TCP Part1

目录 TCP的可靠性 TCP的机制 ack 编号机制 1 发送的数据编号 SN 2 确认的数据编号 ASN 3 编号规则 4 SN在发送TCP Segment 的 Header 中如何体现 5 ASN的填写规则 6 ISN TCP segm
2.4.3 分区状态

最后更新2021 07 17 No Active 分区处于非活动状态在此状态分区仅存在Profile的定义可以有多个Profile定义但都没有激活而不占据任何系统资源 SMS服务模式状态分区启动经过自检后将会根据Profile的
香港爱情电影二十四经

香港爱情电影二十四经之第一经寻找飞一般爱情小说叶锦鸿1997 我们不是在寻找我们只是在给邂逅一个机会叶锦鸿的这部电影清新温暖恬淡动人一幅如流水般的爱情图画三个青年相约一块寻找一个女孩然后确定爱情的归属谁都知道这不是爱情
Vue路由基础部分，Vue路由基础知识

Vue路由基础部分 Vue路由基础知识 1 介绍 2 基础 1 起步 2 动态路由匹配 3 嵌套路由 4 编程式的导航 5 命名路由 6 命名视图 7 重定向和别名 1 介绍 Vue Router 是 Vue js 官方的路由管理器它由V
Chrome浏览器不能同步书签的解决方法

问题现象在Chrome浏览器登陆同步书签的时候提示报错解决方法需要使用Chrome访问助手操作步骤下载Chrome访问助手 https www ggfwzs com 下载后进行解压然后依次点击如下操作把刚才解压的 crx直
Microsoft Office 2007的安装

哈喽大家好今天一起学习的是office2007的安装有兴趣的小伙伴也可以来一起试试手一测试演示参数演示操作系统 Windows 7 不建议win10及以上操作系统使用系统类型 64位演示版本 cn office ultima
opencv进阶学习笔记12：轮廓发现和对象测量

基础版笔记目录 python3 opencv学习笔记汇总目录适合基础入门学习进阶版笔记目录链接 python opencv进阶版学习笔记目录适合有一定基础轮廓发现 1轮廓发现介绍基础版讲解 opencv学习笔记20 图像轮廓 2轮
控制符号的可见性

在普通的C语言中如果您希望将函数或者变量限制在当前文件中需要对其使用static关键字然而在一个包含很多文件的共享库中如果您希望某个符号可以被共享库内部的几个文件访问而又不提供给外部则对符号进行隐藏处理就会比较困难大多数的连
网络重连封装

网络重连部分情况会遇到业务接口失败但我们又不希望让用户去退出应用重启这时候我们可以在网络层设置一个重连机制写这个的时候我想到了当时实现token无痛刷新时没有去解决的一个痛点但我去刷新token的时候如果是获取令牌的接口报错那程序
python读取20万数据Excel文件+拆分数据

python读取20万数据Excel文件使用普通的pandas读取Excel 再结合xlrd读取可能会读取的Excel数据会不全最多只能读取到65535 行的数如果读取超大excel数据时就读取不了解决读取数据不全python代码

python读取20万数据Excel文件+拆分数据

python读取20万数据Excel文件

python读取20万数据Excel文件+拆分数据 的相关文章

随机推荐

热门标签

python读取20万数据Excel文件+拆分数据的相关文章