从 python dataframe 列中删除非 json 对象行

2023-12-02

我有一个数据框，该列包含 json 对象和字符串。我想删除不包含 json 对象的行。

下面是我的数据框的样子：

import pandas as pd

df = pd.DataFrame({'A': ["hello","world",{"a":5,"b":6,"c":8},"usa","india",{"a":9,"b":10,"c":11}]})

print(df)

我应该如何删除仅包含字符串的行，以便在删除这些字符串行后，我可以在下面应用到此列以将 json 对象转换为数据帧的单独列：

from pandas.io.json import json_normalize
df = json_normalize(df['A'])
print(df)

我想我更喜欢使用isinstance check:

In [11]: df.loc[df.A.apply(lambda d: isinstance(d, dict))]
Out[11]:
                            A
2    {'a': 5, 'b': 6, 'c': 8}
5  {'d': 9, 'e': 10, 'f': 11}

如果你也想包含数字，你可以这样做：

In [12]: df.loc[df.A.apply(lambda d: isinstance(d, (dict, np.number)))]
Out[12]:
                            A
2    {'a': 5, 'b': 6, 'c': 8}
5  {'d': 9, 'e': 10, 'f': 11}

将此调整为您想要包含的任何类型...

最后一步，json_normalize 获取 json 对象的列表，无论出于何种原因，Series 都不好（并给出 KeyError），您可以将其设为一个列表，然后就可以开始了：

In [21]: df1 = df.loc[df.A.apply(lambda d: isinstance(d, (dict, np.number)))]

In [22]: json_normalize(list(df1["A"]))
Out[22]:
     a    b    c    d     e     f
0  5.0  6.0  8.0  NaN   NaN   NaN
1  NaN  NaN  NaN  9.0  10.0  11.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

pandas

object

DataFrame

从 python dataframe 列中删除非 json 对象行的相关文章

json_decode 返回 null 并带有不同的引号

json decode foo bar true 这有效但是这个返回NULL json decode foo bar true The json last error 输出4 JSON ERROR SYNTAX 我检查了以下问题的一些答案
使用正则表达式检查整个字符串

我正在尝试检查字符串是否是数字因此正则表达式 d 似乎不错然而由于某种原因该正则表达式也适合 78 46 92 168 8000 这是我不想要的一些代码 class Foo rex re compile d def bar sel
argparse 更改参数的定义

我按如下方式设置参数解析器 parser argparse ArgumentParser parser add argument point help enter a point e g 2 3 4 parser parse args po
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
Emacs：在缓冲区求值期间将参数传递给下级 Python shell

最近我开始使用 Emacs 作为 Python IDE 它不太直观我现在遇到的问题是当使用 C c C c 评估缓冲区时如何将命令行参数传递给下级 python shell 感谢帮助这似乎并不容易实现管理的劣质流程python el模
pybind11：如何将 c++ 和 python 代码打包到一个包中？

我正在尝试使用 CMake 和 pybind 11 将现有的 Python 代码和新的 C 11 代码打包在一起我认为我缺少一些可以添加到 CMake 脚本中的简单内容但在任何地方都找不到它 pybind11 示例只有 C 代码和没有P
Selenium 上的切换窗口

我在 Python 中使用 Selenium 和 PhantomJS 我需要打开一个新窗口并控制它出于测试目的我这样做 from selenium import webdriver driver webdriver PhantomJS
如何列出静态链接的 python 版本中可用的所有 openssl 密码？

在python 2 7 8到2 7 9升级中 ssl模块从使用更改为 DEFAULT CIPHERS DEFAULT aNULL eNULL LOW EXPORT SSLv2 to DEFAULT CIPHERS ECDH AESGCM D
如何在 iPython 中获取最后分配的变量的值？

我是一个完全的 iPython 新手但我想知道是否有办法获取最后分配的变量的值 In 1 long variable name 333 In 2
Tkinter 按钮鼠标右键和左键单击有不同的命令

我正在用 Python 制作扫雷游戏并使用 tkinter 库来创建 gui 有没有绑定到 tkinter 按钮两个命令的方法一个是右键单击按钮时的命令另一个是单击左键时的命令通常按钮仅设计用于单击但 tkinter 允许您为
更新或插入 MySQL Python

如果记录已存在我需要更新一行如果不存在我需要创建一个新记录我理解 ON DUPLICATE KEY 将使用 MYSQLdb 完成此操作但是我无法使其正常工作我的代码如下 cursor database cursor cursor
如何避免在matplotlib中调用latex（输出到pgf）

我使用 matplotlib 及其 pgf 后端来生成包含在 LaTeX 投影仪文档中的绘图当我使用未定义的乳胶命令时我遇到了麻烦但对于我的应用程序我不需要 matplotlib 来使用 Latex 生成标签或注释我只想要正确的
我无法设置顶级标题

我想为 TopLevel 设置标题但 TopLevel 显示 Root 的标题我认为我的下一个脚本与 TkInter 文档中的示例相对应但给了我不好的结果你能解释一下为什么我的设置master title 顶部 in 应用程序顶部
Python 上每个系数具有特定约束的多元线性回归

我目前正在数据集上运行多元线性回归起初我没有意识到我需要限制自己的体重事实上我需要有特定的正权重和负权重更准确地说我正在做一个评分系统这就是为什么我的一些变量应该对音符产生积极或消极的影响然而当运行我的模型时结果不符合我
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
Pandas 使用什么规则来生成视图和副本？

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑例如如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index
使用枚举名称而不是值对 Pydantic 字段进行编码

我有一个枚举类 class Group enum Enum user 0 manager 1 admin 2 我有一个 pydantic 模型 class User BaseModel id int username str group G
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
Spark (Python) 中的 Kolmogorov Smirnov 测试不起作用？

我正在 Python Spark ml 中进行正态性测试看到了我的结果think是一个错误这是设置我有一个标准化的数据集范围 1 到 1 当我做直方图时我可以清楚地看到数据不正常 gt gt gt prices norm hist
Pandas：合并多个数据框并控制列名称？

我想将九个 Pandas 数据帧合并到一个数据帧中对两列进行联接控制列名称这可能吗我有九个数据集它们都有以下列 org name items spend 我想将它们加入到具有以下列的单个数据框中 org name items df

随机推荐

如何在 DBX 中使用连接池？

Well 我设法让代表驱动程序正确设置但连接池仍然给我带来很多麻烦从文档中给出的描述来看连接池似乎应该像这样工作在单个全局 Connection 对象上设置 DBXPool 驱动程序委托将此 Connection 对象用于对数据库
这似乎是一个关于 Javascript 事件的类。它是什么？

我刚刚遇到了一些看起来像这样的 jQuery add row live click add function do something 这似乎与点击添加事件我自己使用自定义事件并认为它们很棒但是git grep我们的代码库上没有显
替换终端中的多行字符串

我正在尝试编写一些代码来覆盖其之前的输出例如原始输出是 1 但是 1 被替换为 2 这使得它看起来好像 1 一开始就没有被输出过我有一个名为的列表列表board 我使用以下代码将此列表转换为多行字符串 rendered board fo
JavaScript：在选项卡之间共享数据[重复]

这个问题在这里已经有答案了在浏览器中打开的选项卡之间共享数据的最佳方式是什么如需更现代的解决方案请查看这个答案引述如下我坚持使用问题中提到的共享本地数据解决方案localStorage 就可靠性效率和浏览器兼容性而言它似乎是最好
为什么 '$_' 与 Perl 单行代码中的 $ARGV 相同？

我在尝试在 Perl 单行代码中打印单引号时遇到了这个问题我最终发现你必须逃离他们这是一些代码来说明我的问题让我们从打印文本文件开始 perl ne chomp print n shortlist txt red orange yel
在C语言中如何使用scanf获取int？

我正在尝试了解从控制台获取输入的不同方法的优点和缺点我很困惑scanf 为什么我需要使用use favNumber代替favNumber 我明白那个 favNumber是地址位置favNumber 但是为什么要这样做呢我觉得这里有一个类
无法在 macOS 应用程序的 Xcode 9 中测试应用内购买

自 iOS11 发布以来测试应用内购买一直是一件痛苦的事如果不是不可能的话虽然我在这里找到了在 iOS 上测试的一个很好的解决方法 https stackoverflow com a 46467498 4514671我找不到 macO
从 SELECT 中的多个选择中获取值

我有一个选择框允许您选择多个选项我需要使用 JavaScript 访问所有选定的值可能是值数组这是获取所选值数组的最佳方法 mySelect val Return an array of the selected options v
升级到 python 3.0 的提示？ [复制]

这个问题在这里已经有答案了因此随着 Python 3 0 现在是 3 1 的最终版本很多人都面临着如何升级而不因向后不兼容而丢失一半代码库的担忧人们有哪些最佳技巧可以避免切换到下一代 Python 时几乎不可避免地出现的许多陷阱也
FFmpeg - PHP 错误代码 127

我正在尝试从 php 执行 FFmpeg 我已经安装了FFmpeg php 并且扩展位于modules目录中并且它显示在phpinfo中 FFmpeg 工作正常因为我可以在终端中运行命令并输出视频但是当我尝试使用以下脚本从 php
检查 SharePoint 365 中的工作簿是否已锁定进行编辑

我在 SharePoint 365 中有一个文档库我使用本地 Excel 宏文件通过 VBA 在线打开 SharePoint 中的工作簿这适用于类似的代码 location https mycompany sharepoint com
尝试使用 Python 和 Selenium 迭代地滚动和抓取网页

我最近问了一个问题参考这里 Python Web 抓取 Beautiful Soup Selenium 和 PhantomJS 仅抓取整个页面的一部分这有助于确定我在抓取滚动时动态更新的页面的所有内容时遇到的问题然而我仍然无法使用
使用pip在django中安装错误

我是 Django 世界的新手我想将其从 pip 安装到我的 Windows 中但在安装时出现此错误 C Users xxxx gt pip install django Collecting django Could not inst
在 Jdbc 中执行带有绑定变量的 SQL 查询

我有一个这样的sql查询 select DEPT DEPTNO as DEPTNO1 DEPT DNAME as DNAME1 DEPT LOC as LOC1 EMP COMM as COMM1 EMP EMPNO as EMPNO1 E
Android：在 webview 中下载在 Oreo 中不起作用，它在 Oreo 设备中强制关闭

下载管理器代码在 Android 中不起作用WebView适用于 Oreo 设备但它适用于旧版本如果不是 Oreo 设备它会提示正在下载文件并被下载但如果是 Oreo 它会强制关闭崩溃下面是我正在使用的代码片段 webVi
数字后跟大写 L

什么是512L意思是或者可能是任何数字后跟大写 L example uint sec然后是一些带有表达式的代码 sec 512L 取出来的XV6代码 mkfs c L代表long 这创建了一个类型的文字long l也可以但看起来像1 所
连接表上的 where 子句

对于下表 ROOM ID NAME 1 ROOM 1 2 ROOM 2 房间状态 ID ROOM ID OPEN DATE 1 1 1 2000 01 01 00 00 00 2 2 1 2000 01 01 00 00 00
向现有列添加自动增量，而不影响当前记录值

我想将列类型更改为AUTO INCREMENT在现有的MyISAM1数据库表数据库目前有数千条记录其中列值非常重要当前值不受影响至关重要我想从最新的最高值开始递增我在 phpmyadmin 中尝试了此操作由 phpmyadmin
编译 SCSS 时出现误报“未定义变量”错误

使用 ruby compass gem 编译 SCSS 时收到错误消息 run var lib gems 1 8 gems compass 0 12 2 bin compass compile out unchanged sass part
从 python dataframe 列中删除非 json 对象行

我有一个数据框该列包含 json 对象和字符串我想删除不包含 json 对象的行下面是我的数据框的样子 import pandas as pd df pd DataFrame A hello world a 5 b 6 c 8 usa

从 python dataframe 列中删除非 json 对象行

从 python dataframe 列中删除非 json 对象行 的相关文章

随机推荐

热门标签

从 python dataframe 列中删除非 json 对象行的相关文章