Python3,Pandas这4种高频使用的筛选数据的方法,不得不说,确实挺好。

2023-11-13

1、引言

小屌丝:鱼哥,share一下 数据筛选的方法呗
小鱼:Excel就可以啊
小屌丝:我要用Pandas
小鱼:这… 让我想一下
小屌丝:这还用想? 这不是张嘴就来。
小鱼:我是想一下,等会吃啥。
在这里插入图片描述

小鱼:知识的力量, 不能用钱来衡量的。
小屌丝:… 我服了你个老六!
小鱼:那我再想一想
小屌丝:别想了,先给我讲完, 然后你在想吧。
小鱼:嗯, 有道理。

2、4种高频使用数据筛选方法

2.1 布尔索引

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2023-07-05
# @Author : Carl_DJ
'''
实现功能:
	布尔索引 进行数据筛选
'''


import pandas as pd

# 创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Amy'],
        'Age': [20, 25, 30, 35],
        'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用布尔索引筛选年龄大于等于30的数据
filtered_data = df[df['Age'] >= 30]
print(filtered_data)

结果展示

  Name  Age       City
2  John   30  Guangzhou
3   Amy   35   Shenzhen

2.2 isin()方法

# -*- coding:utf-8 -*-
# @Time   : 2023-07-05
# @Author : Carl_DJ
'''
实现功能:
	isin()方法 进行数据筛选
'''

import pandas as pd

# 创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Amy'],
        'Age': [20, 25, 30, 35],
        'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用isin()方法筛选城市为北京或上海的数据
filtered_data = df[df['City'].isin(['Beijing', 'Shanghai'])]
print(filtered_data)

结果展示

  Name  Age      City
0  Tom   20   Beijing
1  Nick  25  Shanghai

2.3 query()方法

# -*- coding:utf-8 -*-
# @Time   : 2023-07-05
# @Author : Carl_DJ
'''
实现功能:
	query()方法 进行数据筛选
'''

import pandas as pd

# 创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Amy'],
        'Age': [20, 25, 30, 35],
        'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用query()方法筛选年龄大于等于30且城市为广州的数据
filtered_data = df.query('Age >= 30 and City == "Guangzhou"')
print(filtered_data)

结果展示

  Name  Age       City
2  John   30  Guangzhou

2.4 loc[]方法

# -*- coding:utf-8 -*-
# @Time   : 2023-07-05
# @Author : Carl_DJ
'''
实现功能:
	 loc[]方法 进行数据筛选
'''

import pandas as pd

# 创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Amy'],
        'Age': [20, 25, 30, 35],
        'City': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用loc[]方法筛选年龄大于等于25的数据,并选择Name和City两列
filtered_data = df.loc[df['Age'] >= 25, ['Name', 'City']]
print(filtered_data)

结果展示

   Name       City
1  Nick   Shanghai
2  John  Guangzhou
3   Amy   Shenzhen

3、总结

看到这里,今天的分享就到这里了。
今天主要对pandas的几种常用的数据筛选的方法进行了简单的介绍:

  • 布尔索引筛
  • isin()方法
  • query()
  • loc[]方法

当然, 数据筛选的方法,不止这4种,这里,小鱼就不做过多的介绍了。
也希望能在评论区看到你针对数据筛选的高频操作方法。

我是小鱼

  • CSDN 博客专家
  • 阿里云 专家博主
  • 51CTO博客专家
  • 51认证讲师等
  • 认证金牌面试官
  • 职场面试及培训规划师
  • 多个国内主流技术社区的认证专家博主
  • 多款主流产品(阿里云等)测评一、二等奖获得者

关注我,带你学习更多更专业更前言的Python技术。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python3,Pandas这4种高频使用的筛选数据的方法,不得不说,确实挺好。 的相关文章

随机推荐

  • 浅谈Log4j和Log4j2的区别

    相信很多程序猿朋友对log4j都很熟悉 log4j可以说是陪伴了绝大多数的朋友开启的编程 我不知道log4j之前是用什么 至少在我的生涯中 是log4j带我开启的日志时代 log4j是Apache的一个开源项目 我们不去考究它的起源时间 但
  • 微信小程序如何刷新当前页面

    微信小程序是一种快速发展的移动应用程序开发平台 它提供了许多功能和特性 使开发者能够轻松创建功能丰富的小程序 在开发小程序时 有时我们需要刷新当前页面来更新数据或重新加载页面内容 本文将解释如何在微信小程序中刷新当前页面的代码 引言 微信小
  • Qt5.15.2 Webassembly源码裁剪编译

    第一步 configure debug and release opensource prefix D qt everywhere src compFile platform win32 g nomake examples 第二步 ming
  • 神了!7行代码建起360亿的支付帝国

    点击上方 小詹学Python 选择 星标 公众号 超级无敌干货每日12 00推送给你 大数据文摘出品 来源 medium 编译 lin 夏雅薇 去年 根据CBInsights和普华永道联合发表的MoneyTree 2019Q1报告显示 支付
  • 通过同花顺股票程序化交易接口的止损方法有哪些?

    今天我们就一起来看一下同花顺股票程序化交易接口的止损方法 止损方法主要分为三种 定额止损法 技术止损法以及无条件止损法 下面我们就一个一个的来学习 一 定额止损法 顾明思议这是一种最简单的止损方法 其本质就是将亏损额设定为一个固定的比例 如
  • Java IO流、输入流和输出流总结

    Java流类结构图 流的概念和作用 流是一组有顺序的 有起点和终点的字节集合 是对数据传输的总称或抽象 即数据在两设备间的传输称为流 流的本质是数据传输 根据数据传输特性将流抽象为各种类 方便更直观的进行数据操作 IO流的分类 根据处理数据
  • python xgboost 导入失败_无法在Python中导入xgboost

    我已经成功地使用pip for python2 7 16安装了xgboost 我在macOS High Sierra上使用自制程序安装了这个Python版本 我的问题是无法在Python中导入xgboost 错误消息如下 mac 12864
  • 【翻译】为什么你的活动需要一个行为准则,你需要执行它

    会议的开幕词是一个特别关键的时刻 无论你的舞台是实体的还是虚拟的 其实都不重要 重要的是设定正确的基调 分享有用的信息以提高每个人的经验 让你的听众参与进来 感到兴奋和安全 这些感觉只是保证你的会议成功的一半 另一半来自于伟大的内容和创意
  • 作业2018.12.9日,第1题:使用循环输出:100、95、90.....10、5

    使用循环输出 100 95 90 10 5 int n 100 while n gt 0 if n 5 0 System out println n n
  • 就是这么简单!破解激活AutoCAD 2019 for mac v2019.0.1(附图文讲解)

    AutoCAD是大家都熟悉的软件了 广泛应用于机械设计 工业制图 工程制图 土木建筑 装饰装潢 服装加工等多个行业领域 使用Mac的朋友 AutoCAD 2019 Mac支持演示的图形 渲染工具和强大的绘图及三维打印功能 让您的设计将会更加
  • 第20章:python自动化——关键字驱动类实现

    目录 一 关键字驱动设计模式介绍 二 关键字驱动设计模式原理 三 关键字驱动设计模式代码实现 1 逻辑代码web keys py文件内容 2 测试代码web test py文件内容 四 总结 一 关键字驱动设计模式介绍 在自动化测试中 分为
  • PCL 点云投影到直线(C++详细过程版)

    目录 一 算法原理 二 代码实现 三 结果展示 1 原始点云 2 投影结果 一 算法原理 直线方程有三种表示法 一般式 点向式 参数式 PCL中统一采用的是点向式 直线的点向式方程为 x x 0 m y
  • 星星之火:国产讯飞星火大模型的实际使用体验(与GPT对比)

    AIGC技术内容创作征文 全网寻找AI创作者 快来释放你的创作潜能吧 文章目录 1 前言 2 测试详情 2 1 文案写作 2 2 知识写作 2 3 阅读理解 2 4 语意测试 重点关注 2 5 常识性测试 重点关注 2 6 代码理解与生成
  • 【17 > 分布式接口幂等性】1. 概述与接口重试的问题

    一 本章概述 二 接口幂等性 2 1 定义 2 2 运用场景 2 3 保证幂等性的策略有哪些 2 4 如何实现 2 5 如何操作 一 本章概述 什么是幂等性 幂等性设计的 核心思想 select updates delete insert
  • HTML的列表标签,表格标签

    前端学习经验 3 HTML 列表标签 li 此标签定义列表项目 用于有序列表 ol 和无序列表 ul 中 无序列表标签 ul 无序列表 ul 此标签定义无序列表 例 ul li 无序列表1 li li 无序列表2 li li 无序列表3 l
  • C#驱动ESP32控制机器臂

    物料清单 介绍 NET nanoFramework 是一个免费的开源平台 可以为受限嵌入式设备编写托管代码应用程序 它适用于多种类型的项目 包括物联网传感器 可穿戴设备 学术概念验证 机器人技术 业余爱好者 创客创作甚至复杂的工业设备 通过
  • 【VTK】FindPokedRenderer函数

    最近写VTK的响应程序发现鼠标响应函数最后都会有InvokeEvent函数 部分有FindPokedRenderer 对这两个函数的运行机制还不是很了解 现在具体介绍一下 1 FindPokedRenderer 作为actor的管理工具 还
  • 基于linux下的dm9000网卡移植全分析

    DM9000可以直接与ISA总线相连 也可以与大多数CPU直接相连 Mini2440采用的是dm9000直接连接CPU s3c2440 上 就像是nandflash一样直接被挂在CUP上 被挂在s3c2440的bank4上 小插曲1 s3c
  • web项目部署到某云Linux服务器的详细步骤

    一 安装xshell 和 xftp 1 xshell连接服务器 方式有几种 这里只介绍其中之一 在 某云 密钥对创建密钥对 然后会得到下载的密钥对文件 打开xshell 打开 新建 上图中的主机填某云 实例 中的 然后在xshell 用户身
  • Python3,Pandas这4种高频使用的筛选数据的方法,不得不说,确实挺好。

    Pandas数据筛选方法 1 引言 2 4种高频使用数据筛选方法 2 1 布尔索引 2 2 isin 方法 2 3 query 方法 2 4 loc 方法 3 总结 1 引言 小屌丝 鱼哥 share一下 数据筛选的方法呗 小鱼 Excel