Python Pandas 数据拼接/排序/重置

2023-11-06

Pandas 数据拼接/排序/重置

一、数据拼接
- 1.1 行拼接（纵向，第 0 维）pd.concat([df1,df2])
- 1.2 列拼接（横向，第 1 维）pd.concat([df1,df2], axis=1)
二、排序
三、对列标签重命名 df.rename()

一、数据拼接

准备数据：

import pandas as pd

d_1 = {'name' : pd.Series(['a', 'b', 'c', 'd'], index=[0,1,2,3]),
   'attri_1' : pd.Series([1.1, 2.2, 3.3, 4.4,5.5], index=[0,1,2,3,4]),
     'attri_2' : pd.Series([1, 2, 3, 4, 5], index=[0,1,2,3,4])
     }

d_2 = {'name' : pd.Series(['aa', 'bb', 'cc', 'dd','ee'], index=[0,1,2,3,4]),
   'attri_1' : pd.Series([2.1, 3.2, 4.3, 5.4, 6.5], index=[0,1,2,3,4]),
     'attri_2' : pd.Series([1, 2, 3, 4, 5], index=[0,1,2,3,4])
     }

df_1 = pd.DataFrame(d_1)

df_2 = pd.DataFrame(d_2)

print(df_1)
print(df_2)

运行结果：

  name  attri_1  attri_2
0    a      1.1        1
1    b      2.2        2
2    c      3.3        3
3    d      4.4        4
4  NaN      5.5        5
  name  attri_1  attri_2
0   aa      2.1        1
1   bb      3.2        2
2   cc      4.3        3
3   dd      5.4        4
4   ee      6.5        5

1.1 行拼接（纵向，第 0 维）pd.concat([df1,df2])

df_3 = pd.concat([df_1,df_2])
print(df_3)

运行结果：

  name  attri_1  attri_2
0    a      1.1        1
1    b      2.2        2
2    c      3.3        3
3    d      4.4        4
4  NaN      5.5        5
0   aa      2.1        1
1   bb      3.2        2
2   cc      4.3        3
3   dd      5.4        4
4   ee      6.5        5

注意事项：

这里的两组数据列标签需要一致
拼接后的 index 还是保留原先的

1.2 列拼接（横向，第 1 维）pd.concat([df1,df2], axis=1)

df_4 = pd.concat([df_1,df_2], axis=1)
print(df_4)

运行结果：

  name  attri_1  attri_2 name  attri_1  attri_2
0    a      1.1        1   aa      2.1        1
1    b      2.2        2   bb      3.2        2
2    c      3.3        3   cc      4.3        3
3    d      4.4        4   dd      5.4        4
4  NaN      5.5        5   ee      6.5        5

二、排序

准备数据：

d = {'name' : pd.Series(['a', 'b', 'c', 'd'], index=[0,1,2,3]),
   'attri_1' : pd.Series([5.1, 4.2, 2.3, 1.4,3.5], index=[0,1,2,3,4]),
     'attri_2' : pd.Series([1, 2, 3, 4, 5], index=[0,1,2,3,4])
     }

df = pd.DataFrame(d)

print(df)

运行结果：

  name  attri_1  attri_2
0    a      5.1        1
1    b      4.2        2
2    c      2.3        3
3    d      1.4        4
4  NaN      3.5        5

2.1 从小到大排序（默认）df.sort_values()

print(df.sort_values('attri_1')) # 排序后，index 也会相应变化

运行结果：

  name  attri_1  attri_2
3    d      1.4        4
2    c      2.3        3
4  NaN      3.5        5
1    b      4.2        2
0    a      5.1        1

2.2 从大到小排序（逆序）df.sort_values(ascending =False)

print(df.sort_values('attri_1',ascending =False))
print(df) # 这里可以看到，排序不会直接作用于原数据，所以这里打印出来的还是原来的形式

运行结果：

  name  attri_1  attri_2
0    a      5.1        1
1    b      4.2        2
4  NaN      3.5        5
2    c      2.3        3
3    d      1.4        4
  name  attri_1  attri_2
0    a      5.1        1
1    b      4.2        2
2    c      2.3        3
3    d      1.4        4
4  NaN      3.5        5

2.3 对 index 进行排序 df.sort_index()

df_5 = df.sort_values('attri_1')

print(df_5)
print(df_5.sort_index())

运行结果：

  name  attri_1  attri_2
3    d      1.4        4
2    c      2.3        3
4  NaN      3.5        5
1    b      4.2        2
0    a      5.1        1
  name  attri_1  attri_2
0    a      5.1        1
1    b      4.2        2
2    c      2.3        3
3    d      1.4        4
4  NaN      3.5        5

2.4 对 index 进行重置（变成默认的0～n）df.reset_index()

d = {
   'attri_1' : pd.Series([5.1, 4.2, 2.3, 1.4,3.5], index=['a', 'b', 'c', 'd', 'e'])
     }
df = pd.DataFrame(d)

print(df)
print(df.reset_index()) # 这里重置了 index ，把原来的 index 变为列，标签为 'index'

运行结果：

   attri_1
a      5.1
b      4.2
c      2.3
d      1.4
e      3.5
  index  attri_1
0     a      5.1
1     b      4.2
2     c      2.3
3     d      1.4
4     e      3.5

三、对列标签重命名 df.rename()

d = {
   'attri_1' : pd.Series([5.1, 4.2, 2.3, 1.4,3.5], index=['a', 'b', 'c', 'd', 'e'])
     }
df = pd.DataFrame(d)
print(df)
print(df.rename(columns={'attri_1':'new'}))

运行结果：

   attri_1
a      5.1
b      4.2
c      2.3
d      1.4
e      3.5
   new
a  5.1
b  4.2
c  2.3
d  1.4
e  3.5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python笔记

机器学习

python

数据结构

大数据

Python Pandas 数据拼接/排序/重置的相关文章

为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
使用字典映射数据帧索引

为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico

随机推荐

微信小程序之拨打电话

微信小程序拨打电话功能的实现是采用wx makePhoneCall 具体方法如下 wxml lt view gt 电话 15888888888 lt view data ph 15888888888 bindtap callPhone gt
【Android 12 AOSP学习】Android 12源码下载编译

一搭建环境 liunx系统 Ubuntu20 04 Android系统 12 1 安装 Repo 下载Repo前先安装 curl 库 sudo apt get install curl 下载好 curl 库后设置清华源下载 Repo 然
前端 JavaScript 提取 JSON 数据

原文地址假如我们从后端接收到了以下 JSON 数据 id 1 name Xu Albter age 18 使用 JSON parse 方法处理以上数据将其转换为 JavaScript 对象 var obj JSON parse id 1
select函数缺陷分析

与poll和epoll不同 select函数是事件为单位组织文件描述符监视的行为较为单一函数原型 int select int nfds fd set readfds fd set writefds fd set exceptfds s
链表应用：两数相加

关于链表链表是一种极其重要的数据结构因为对指针和抽象思维的要求较高一度成为身边同学最痛恨的对象我在将这里演示如何使用链表制作一个可以按位储存数字的容器鉴于本人亦初学者有错误请各位在评论区指正这里还是以介绍链表为主算法部分苦于
SpringCloud和微服务介绍

SpringCloud介绍微服务架构是什么微服务实例的开发服务的注册与发现负载均衡服务容错 API网关分布式配置中心调试部署持续集成 SpringCloud介绍 SpringCloud是在SpringBoot的基础上构建的
一个完整详细的二维SVR案例分析过程

文章目录案例介绍数据预处理函数拟合仿真 SVR建模模型调参案例介绍首先此次案例是以油气开发为背景选取加粗样式其中重要的两个参数含油饱和度和孔隙度分别作为此次案例的自变量和因变量进行试验按照正常的案例分析步骤进行操作此次为
神经网络（ANN）

算法介绍概念人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络它的组织能够模拟生物神经神经系统对真实世界物体所作出的交互反应在实际应用中 80 90 的人工神经网络模型是采用误差反转算法或其变形形式的网络模型一个神经网络
小程序的配置文件和小程序的模板语法

微信小程序小程序的配置文件一个小程序应用程序会包括会有最基本的两种配置文件一种是全局的 app json 一种是页面自己的 page json 注意配置文件中不可以出行注释 1 1 全局配置文件 app json app json
主题模型（Topic Model）与LDA算法

Topic Model 主题模型 Topic Model 是以非监督学习的方式对文档的隐含语义结构 latent semantic structure 进行聚类 clustering 的统计模型主题模型认为在词 word 与文档 docu
第十三章：QT多线程(QThread)

回顾第一章 Qt的概述第二章在Ubuntu编写第一个Qt程序第三章 Qt的字符串和字符编码第四章 Qt的信号和槽第五章 Qt容器窗口父窗口第六章面向对象的Qt编程第七章 Qt设计师使用 designer 第八章 Qt创造
Unittest框架多个testcase之间全局变量的调用

unittest模块进行接口自动化的时候遇到以下场景新增修改查看删除一个项目配置流程但是每次用真实数据请求数据库就会增加很多脏数据所以就产生了数据一条龙服务从新增到删除涉及到了Unittest下个接口需要调用上个接口的返回
mysql数据库访问控制查询_MySQL ------ 管理用户对数据库的访问控制（GRANT 与 REVOKE）（二十九）...

数据库服务器通常包含着关键的数据所以为了确保这些数据的安全和完整需要要利用访问控制 MySQL服务器的安全基础是用户应该对他们需要的数据具有适当的访问权既不能多也不能少即用户不能对过多的数据具有访问权访问控制需要给用户提供他们所
电子计算机的发展史

1 电子计算机元器件变化继电器真空管晶体管 2 计算机的出现背景 20世纪人口暴增科学与工程进步迅速航天计划成形以上导致数据的复杂度急剧上升计算量暴增对于计算的自动化高速有迫切的需求 3 电子计算机的发展 1945年哈佛
antd table合并行或者列（动态添加合并行、列）

antd table合并行或者列动态添加合并行列表头只支持列合并使用 column 里的 colSpan 进行设置表格支持行列合并使用 render 里的单元格属性 colSpan 或者 rowSpan 设值为 0 时设置的
Ubuntu系统安装企业微信和微信

一 Ubuntu16 04安装企业微信 1 安装git工具 sudo apt install wget g git 2 安装deepin wine git clone https gitee com wszqkzqk deepin wine
UE4 行为树装饰器（Decorator）简单实用说明（1）

在行为树标准模型中条件语句为 Task 叶节点除成功和失败外不执行任何操作虽然也可以使用传统的条件 tasks 但还是强烈推荐您使用 Decorator 系统作为条件语句使用 decorators 而非 tasks 作为条件语句有多
光猫超级账号密码、宽带账号密码获取

光猫超级账号密码宽带账号密码获取目的与起因租房宽带是电信的 Ipv6 之前笔记本使用 Ipv6 地址可以直接被手机通过移动网络无需中转进行远程桌面连接的目前尝试了在局域网内是可以实现的应该是电信屏蔽了3389端口在光猫路由器修
tcp 序列号

父 tcp 状态 from异常流程个人渣记录仅为自己搜索用的博客 CSDN博客转载请注明出处 6 TCP6 TCP 协议序号和确认号 tcp 最终确认序号 Allen 的博客 CSDN博客6 TCP 接下来的内容是学习后续内容的基础
Python Pandas 数据拼接/排序/重置

Pandas 数据拼接排序重置一数据拼接 1 1 行拼接纵向第 0 维 pd concat df1 df2 1 2 列拼接横向第 1 维 pd concat df1 df2 axis 1 二排序 2 1 从小到大排序默认

Python Pandas 数据拼接/排序/重置

Pandas 数据拼接/排序/重置

一、数据拼接

1.1 行拼接（纵向，第 0 维）pd.concat([df1,df2])

1.2 列拼接（横向，第 1 维）pd.concat([df1,df2], axis=1)

二、排序

2.1 从小到大排序（默认）df.sort_values()

2.2 从大到小排序（逆序）df.sort_values(ascending =False)

2.3 对 index 进行排序 df.sort_index()

2.4 对 index 进行重置（变成默认的0～n）df.reset_index()

三、对列标签重命名 df.rename()

Python Pandas 数据拼接/排序/重置 的相关文章

随机推荐

热门标签

Python Pandas 数据拼接/排序/重置的相关文章