从列表列表创建 pandas 数据框，但有不同的分隔符

2024-03-03

我有一个列表列表：

     [['1', 'Toy Story (1995)', "Animation|Children's|Comedy"],
     ['2', 'Jumanji (1995)', "Adventure|Children's|Fantasy"],
     ['3', 'Grumpier Old Men (1995)', 'Comedy|Romance']]

我想最终得到一个包含这些列的 pandas 数据框。

cols = ['MovieID', 'Name', 'Year', 'Adventure', 'Children', 'Comedy', 'Fantasy', 'Romance']

For the 'Adventure', 'Children', 'Comedy', 'Fantasy', 'Romance'列，数据将为 1 或 0。

我试过了：

for row in movies_list:
    for element in row:
        if '|' in element:
            element = element.split('|')

然而，原始列表没有发生任何变化..完全被难住了。

Use DataFrame构造函数与str.get_dummies http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.get_dummies.html:

L = [['1', 'Toy Story (1995)', "Animation|Children's|Comedy"],
     ['2', 'Jumanji (1995)', "Adventure|Children's|Fantasy"],
     ['3', 'Grumpier Old Men (1995)', 'Comedy|Romance']]
df = pd.DataFrame(L, columns=['MovieID','Name','Data'])


df1 = df['Data'].str.get_dummies()
print (df1)
   Adventure  Animation  Children's  Comedy  Fantasy  Romance
0          0          1           1       1        0        0
1          1          0           1       0        1        0
2          0          0           0       1        0        1

对于列Name and Year need split http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.split.html and rstrip http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.rstrip.html用于删除尾随), also Year被转换为ints.

df[['Name','Year']] = df['Name'].str.split('\s\(', expand=True)
df['Year'] = df['Year'].str.rstrip(')').astype(int)

最后删除列Data并添加df1原始由join http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.join.html:

df = df.drop('Data', axis=1).join(df1)
print (df)
  MovieID              Name  Year  Adventure  Animation  Children's  Comedy  \
0       1         Toy Story  1995          0          1           1       1   
1       2           Jumanji  1995          1          0           1       0   
2       3  Grumpier Old Men  1995          0          0           0       1   

   Fantasy  Romance  
0        0        0  
1        1        0  
2        0        1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从列表列表创建 pandas 数据框，但有不同的分隔符的相关文章

Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如
如何获取所有mysql元组结果并转换为json

我能够从表中获取单个数据但是当我试图获取表上的所有数据时我只得到一行 cnn execute sql rows cnn fetchall column t 0 for t in cnn description for row in ro
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

计算 DISTINCT 值的出现次数

我试图找到一个 MySQL 查询该查询将在特定字段中查找不同的值计算该值出现的次数然后按计数对结果进行排序示例数据库 id name 1 Mark 2 Mike 3 Paul 4 Mike 5 Mike 6 John 7 Mark
GAE - 部署错误：“AttributeError：无法设置属性”

当我尝试部署我的应用程序时出现以下错误 Starting update of app flyingbat123 version 0 1 Getting current resource limits Password for avigma
Prestashop 送货时选择隐藏/显示付款方式

我试图弄清楚如何在选择送货方式时显示隐藏付款方式我尝试了几个解决方案但它对我不起作用其中之一是这个
如何在Flutter中像Youtube一样显示之前的时间

我正在编写一个 flutter 应用程序来克隆一些 Youtube 功能Youtube API V3 该应用程序获取字符串形式的视频时间戳来自 YouTube 视频 API 每个时间戳都具有以下格式 YYYY MM DDTHH MM SSZ
如何计算新点位于 Voronoi 图的哪个位置？

我写了一个小脚本来显示 voronoi 图M点来自本教程 https docs scipy org doc scipy 0 18 1 reference generated scipy spatial Voronoi html I use
如何获取 Xamarin.Android 的 Mono VM 的堆快照？

背景我正在尝试追踪 Xamarin Android 应用程序中的内存泄漏使用 DDMS 和 Eclipse Memory Profiler 我能够查看哪些对象处于活动状态当试图跟踪是什么让它们保持活力时 GC Root 我只看到本机
如何删除前导和尾随空格？

我在用着awk gsub t t print in txt gt out txt删除前导和尾随空格问题是输出文件实际上有尾随空格所有行的长度相同它们都用空格填充我缺少什么 UPDATE 1 该问题可能是由于尾随空格不是正常空格而
Nuxt，转换不适用于子路由（使用 NuxtChild 显示）

我无法为我的子路线进行转换我有以下页面 pages child id vue child vue index vue 在索引和任何子路由之间导航都会触发转换但是当从一个子路由导航到另一子路由时不会发生转换注意有静态路由 child和
extern 与 c 中变量的全局定义

我有以下我感兴趣的源代码 include
从 XML 结束标记填充数组

我正在尝试创建一个字段名称数组以便稍后在脚本中使用正则表达式让我大吃一惊我已经很久没有写代码了字段名称嵌入在 XML 标记中因此我想可以从第一行数据的结束标记中提取它们我看不到如何正确填充数组任何人都可以为我提供一些启示吗 m
万向节锁是怎么发生的？

所以我在网上搜索我在想象如何发生万向节锁定根据我所看到的当两个或多个轴对齐失去一定的自由度时就会发生这种情况但我无法想象这些轴将如何开始对齐我的意思是当我绕 x 轴旋转对象时例如 y 轴和 z 轴是否不会随 X 轴旋转以保持
使用 PyQt5 将 qDebug 输出重定向到文件

我使用 python2 7 Qt5 5 和 PyQt5 实现了一个应用程序我使用Python记录器工作logging 模块日志消息都发送到 stderr 和日志文件但是 Qt 日志消息仅出现在 stderr 中我找不到将它们重定向到
带有标记和线条的传单

我将 leafletjs 与 geojson 一起使用但我无法同时使用标记绘制折线所以我的解决方案是先绘制折线然后添加标记我认为这不是一个好的方法那么还有其他解决方案吗这是我的代码 function DrawLine mymap
SSRS独特的查找集函数

我在用着Join Lookupset 查找返回序列号的唯一组值这是我的功能 Join LookupSet Fields itemId Value Fields UseByDate Value Fields rackId Value Fie
Python：如何使用 BeautifulSoup 模拟点击

我不想使用 selenium 因为我不想打开任何浏览器该按钮会触发 Javascript 方法来更改页面中的某些内容我想模拟按钮单击以便我可以从中获取输出示例不是按钮实际执行的操作我输入一个名字例如 John 按下按钮它会
如何在 Action 类之外将错误消息从 Struts2 发布到 HTML

我有一个注册程序当我在数据库中插入一条记录时我将实例化一个类并调用该方法insert 当我插入相同的记录时当然会出现重复数据错误和大量错误消息我想捕捉它try and catch 我能做到但是我不知道如何将消息显示到 JSP 据
提高 jQuery 模板性能

Update 显然 jQuery 模板可以被编译并且它有助于提高模板的性能if 语句 shown here http jsperf com complex template vs concat 4 但如图所示here http jsper
MFC> 将对话框连接到对话框类

我在现有的资源文件中定义了一个新对话框及其控件我还创建了一个新文件它将处理从此对话框生成的事件但我不确定如何连接这两者是声明enum IDD IDD NEW DIALOG 连接两者所需的一切或者我们应该添加一些其他声明在 MFC
网络调用 /.well-known/openid-configuration/ 和 /.well-known/openid-configuration/jwks

I have 身份服务器4 具有 OpenId Connect 和混合流的 Mvc 应用程序 WebApi应用程序假设用户已经获得带有 id token 和访问令牌的 cookie 然后他从 mvc 应用程序调用一个操作 var clie
从列表列表创建 pandas 数据框，但有不同的分隔符

我有一个列表列表 1 Toy Story 1995 Animation Children s Comedy 2 Jumanji 1995 Adventure Children s Fantasy 3 Grumpier Old Men 199

从列表列表创建 pandas 数据框，但有不同的分隔符

从列表列表创建 pandas 数据框，但有不同的分隔符 的相关文章

随机推荐

热门标签

从列表列表创建 pandas 数据框，但有不同的分隔符的相关文章