python中dict数据转DataFrame，pandas实现类似sql查询语句

2023-10-27

目的：将一组dict字典数据转为pandas的DataFrame格式，然后用pandas实现类似sql语句中select * from xxx where condition的功能。

一、python中将dict格式数据转为DataFrame格式

转换方法有多种，看需求的DataFrame格式是什么样的。我采用的是将dict中key作为列，值作为行的方法

在我的任务中，需要将多个字典合并到一个DataFrame中，因此采用如下方法：

第一步将多个字典存入list中。

第二步由pd.DataFrame()转格式。

# 一组字典
dict1 = {'name': '张三', 'id': '0', 'value': 'aaa'}
dict11 = {'name': '张三', 'id': '0', 'value': 'aaa2'}
dict12 = {'name': '张三', 'id': '0', 'value': 'aaa3'}
dict13 = {'name': '张三', 'id': '0', 'value': 'aaa3'}

dict2 = {'name': '李四', 'id': '1', 'value': 'bbb'}
dict3 = {'name': '王五', 'id': '2', 'value': 'ccc'}
dict4 = {'name': '马六', 'id': '3', 'value': 'ddd'}

# 存入list
tmp_list = [dict1, dict11, dict12, dict13, dict2, dict3, dict4]

# 转为DataFrame
df = pd.DataFrame(tmp_list)
print(df)

result:
  name id value
0   张三  0   aaa
1   张三  0  aaa2
2   张三  0  aaa3
3   张三  0  aaa3
4   李四  1   bbb
5   王五  2   ccc
6   马六  3   ddd

dict转DataFrame参考：Python 将字典(dict)转换为DataFrame_python字典转dataframe_pumpkin96的博客-CSDN博客

二、使用pandas内置方法实现类似sql的select查询

(1) 使用pandas进行select操作：在SQL中，如果我们要从df中选取前三行的name和value列数据，SQL的语法为：

select name, value from df limit 3

使用pandas进行查询语法为：

result = df[['name', 'value']].head(3)

print(result)

result:
  name value
0   张三   aaa
1   张三  aaa2
2   张三  aaa3

(2) pandas进行where条件查询：在SQL中，查询name为张三的所有行，where操作语法为：

select * from df where name = '张三'

pandas语法为：

result = df[df['name'] == '张三']

print(result)

  name id value
0   张三  0   aaa
1   张三  0  aaa2
2   张三  0  aaa3
3   张三  0  aaa3

(3) 多个条件查询时，sql中语法为and和or。

select * from df where name = '张三' and value =aaa3

pandas中使用符号“&”和“|”实现。

result = df[(df['name'] == '张三')&(df['value'] == 'aaa3')]

print(result)

  name id value
2   张三  0  aaa3
3   张三  0  aaa3

同时使用df.value_counts()或者len()可以统计查询结果的数量。

result = df[(df['name'] == '张三')&(df['value'] == 'aaa3')].value_counts()

print(result)

name  id  value
张三    0   aaa3     2
dtype: int64

(4) pandas中去重操作，sql中语法为distinct。

select distinct * from temp where name = '张三'

此时sql搜索结果为：

若sql语句为distinct name：

select distinct name from temp where name = '张三'

则是对name进行去重，sql的去重结果保留了重复时的第一行数据。

在pandas中使用df.drop_duplicates()进行去重操作。

a = df[df['name'] == '张三']  # select * from temp where name = '张三'操作

# distinct去重操作
result = a.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
print(result)

  name id value
0   张三  0   aaa
1   张三  0  aaa2
2   张三  0  aaa3

第二条sql语句pandas可以这样写。

# select name from df where name = '张三'
a = df[['name']][df['name'] == '张三']

# distinct去重操作
result = a.drop_duplicates(subset='name', keep='first', inplace=False, ignore_index=False)  
print(result)

result:
  name
0   张三

其中：

subset：设置识别重复项的列名或列名序列，对某些列来识别重复项，默认情况下为None，使用所有列，即识别完全相同的内容，若设置，则仅识别对应的列；
keep参数：确定要保留哪些重复项，可选值有first，last，False，默认为first。
1. first：删除除第一次出现的重复项，即保留第一次出现的重复项
2. last：保留最后一次出现的重复项
3. False：删除所有重复项
inplace参数：表示是否返回副本，默认为False表示返回副本，设置为True表示在原数据上修改
ignore_index参数：指示是否重新生成行索引，默认为False表示不生成，此时会导致index乱序，设置为True表示重新按照0，1 ，2…生成index

pandas实现sql查询参考：

https://www.cnblogs.com/diruodaichang/p/11423742.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pndas

sql

pandas

python中dict数据转DataFrame，pandas实现类似sql查询语句的相关文章

python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
Python BeautifulSoup XML 解析

我编写了一个简单的脚本来使用 BeautifulSoup 模块解析 XML 聊天日志标准 soup prettify 工作正常只是聊天日志中有很多绒毛您可以在下面看到我正在使用的脚本代码和一些 XML 输入文件 Code import
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
更新plpgsql中触发器函数中的多列

给出以下架构 create table account type a id SERIAL UNIQUE PRIMARY KEY some column VARCHAR create table account type b id SERIA
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
SQL Group BY，每个组的前 N 个项目

我有一个 SQL 查询可以获取给定商店中销量最高的 5 件商品 SELECT TOP 5 S UPCCode SUM TotalDollarSales FROM Sales S WHERE S StoreId 1 GROUP BY S U
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
在存储过程结束时显式删除本地临时表有什么好处？

考虑以下伪 T SQL 代码由存储过程执行 CREATE TABLE localTable
Matplotlib Scatter - ValueError：RGBA 序列的长度应为 3 或 4

我正在尝试为我的功能绘制图表但不断收到此错误 ValueError RGBA sequence should have length 3 or 4 每当我只有 6 种形状时代码就可以完美运行但现在我将其增加到 10 种它就不起作用了
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

openai.error.RateLimitError: You exceeded your current quota, please check your plan and billing det

报错此错误消息表明您已达到API的最大月支出硬限制这意味着您已经消耗了分配给计划的所有积分或单位并且已经达到计费周期的限制这种情况可能有几个原因例如您使用的是高容量或复杂的服务每个请求需要消耗大量的信用额度或单位您使用的是
OBS推流工具介绍及桌面录屏推流功能实现

OBS推流工具介绍及桌面录屏推流功能实现文章目录 OBS推流工具介绍及桌面录屏推流功能实现 1 OBS工具介绍 2 OBS工具安装及简单使用 2 1 安装步骤 2 2 简单使用介绍 3 OBS实现桌面录屏推流工具实现 4 总结流媒体开发
第十二届蓝桥杯c++b组

问题 New Online Judge 1 空间 P1555 蓝桥杯2021初赛空间 New Online Judge ecustacm cn 1MB 1024KB 1KB 1024B byte字节 1B byte字节 8b bit位 2
OpenGL平台上的Teapot绘制与渲染（代码详细注释）

include
dcdc芯片效率不高的原因_DCDC变换器轻载时三种工作模式

目前高频高效的DCDC变换器的应用越来越广泛通常在满输出负载时 DCDC变换器工作于CCM即连续电流模式但是当系统的输出负载从满载到轻载然后到空载变化的过程中系统的工作模式也会发生相应的改变下面以降压型Buck变换器为例说明DCD
Qt6 for Android 环境搭建

作者一去二三里个人微信号 iwaleon 微信公众号高效程序员说起 Qt 各平台的开发环境搭建最难的当属 Android 环境因为要配置的东西比较多而且配置过程很容易出现问题例如 JDK Android SDK NDK 等
Python调用Stata

一软件要求 python3 Stata 17 PyCharm 二环境配置 2 1 stata基础配置 stata激活无论是MP版本还是SE版本都需要进行证书激活即在stata安装目录下存在LIC文件 stata中配置pytho
202324读书笔记

202323读书笔记一枝瘦骨写空山金农画的金石气以一枝瘦骨写空山之妙一枝瘦骨写空山金农画的金石气文人画的真性作者朱良志荷风四面人在当中消受这世界的清凉也回应这世界的灵韵生命智慧是金农之绘画艺术具有长久生命力的基点
Think in java书籍阅读小结

一博客说明本篇博客为本人看完think in java这本书后个人查漏补缺的一些知识点记录下来作为笔记使用二变量初始化顺序在一个类里变量初始化的顺序是由变量在类内的定义顺序决定的即使变量定义大量遍布于方法定义的后面那些变
python如何处理表格，将其转换为CSV，直接编辑或调用CSV模块

python如何处理表格将其转换为CSV 直接编辑或调用CSV模块 1 csv文件优点 2 csv 与 txt 3 写入csv文件方法 3 1 方法一直接写入 3 2 方法二调用CSV模块 4 读取CSV文件 pycharm 工作路径
Python的随机矩阵生成

导入模块 random模块 numpy中的random函数 python中有两个模块可以生成随机数该博客以的numpy模块为例进行生成随机数因为矩阵要生成大量的随机数据故推荐使用numpy模块生成随机数生成随机数以矩阵为例生成随
将未经安全技术处理的计算机,4322【标准答案】单选题 1. 将未经安全技术处理的退出使用的涉密计算机、涉密存储设备____或者改作其他用途的。依法给予处分；构成犯罪的，依法追究刑事责任。 A: 赠送...

lt gt 标准答案单选题 1 将未经安全技术处理的退出使用的涉密计算机涉密存储设备或者改作其他用途的依法给予处分构成犯罪的依法追究刑事责任 A 赠送 B 出售 C 丢弃 D 以上都是习题单选题 1 将未经安全技术处理的退出
vscode里面配置Git默认终端

文章目录前言一为什么VsCode的终端默认文件选择项里面会没有Git的终端配置二配置默认Git终端 1 打开settings json文件 2 将配置找到小编亲测 3 找到Git路径 4 结果总结废话很多看完就对能行前言
OpenCV-Python绑定如何工作及如何扩展新模块到Python

OpenCV Python绑定如何工作及如何扩展新模块到Python 1 OpenCV Python 绑定的基本版本 2 如何将OpenCV的新模块扩展到 Python 参考这篇博客将介绍 OpenCV Python 绑定是如何生成的以及
127.0.0.1拒绝了我们的连接请求

问题描述浏览器打不开127 0 0 1 显示拒绝连接试着ping了一下需要指明一点 1是ipv6的地址但正常localhost应该指向127 0 0 1 使用Windows自带的网络诊断工具出现了 127 0 0 1未设置为接受端
【毕业设计】便携式STM32的红外信号分析仪 - 单片机物联网嵌入式

文章目录 0 前言 1 简介 2 主要器件 3 实现效果 4 设计原理 5 部分核心代码 5 最后 0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的毕设题目缺少创新和亮点往往达不到毕业答辩的要求这两年不断有学弟学妹告诉
C#开发之——GetType方法(6.5)

一概述 C 中GetType方法用于获取当前实例的类型返回值为System Type类型 C 中GetType方法不含有任何参数是非静态方法使用任何对象都能直接调用该方法二实例创建字符串类型的变量整数类型的变量以及Stude
傻瓜式3分钟理解：工厂模式（简单工厂+工厂方法+抽象工厂）

一给我一句话概括简单工厂工厂类中根据条件决定一个接口由哪个具体产品类来实现工厂方法创建多个工厂类各个工厂类中都对应一个获得接口A实例的方法用户决定使用哪个工厂抽象工厂对工厂方法进行扩展各个工厂类中再增加一个获得接口
移位运算

div class markdown views div
python中dict数据转DataFrame，pandas实现类似sql查询语句

目的将一组dict字典数据转为pandas的DataFrame格式然后用pandas实现类似sql语句中select from xxx where condition的功能一 python中将dict格式数据转为DataFrame格式

python中dict数据转DataFrame，pandas实现类似sql查询语句

python中dict数据转DataFrame，pandas实现类似sql查询语句 的相关文章

随机推荐

热门标签

python中dict数据转DataFrame，pandas实现类似sql查询语句的相关文章