pandas:如何绘制 pandas 中 IMDB 电影的电影数量与类型的饼图?

2024-01-28

我有以下数据集:

import pandas as pd
import numpy as np 
%matplotlib inline

df = pd.DataFrame({'movie' : ['A', 'B','C','D'], 
                   'genres': ['Science Fiction|Romance|Family', 'Action|Romance',
                              'Family|Drama','Mystery|Science Fiction|Drama']},
                  index=range(4))
df

我的尝试

# Parse unique genre from all the movies
gen = []
for g in df['genres']:
    gg = g.split('|')
    gen = gen + gg
    gen = list(set(gen))

print(gen)

df['genres'].value_counts().plot(kind='pie')

I got this image: enter image description here

但我想要每个不同类型的饼图。

我们如何获得每种独特类型的电影数量?


因此,单行解决方案:

df.genres.str.get_dummies().sum().plot.pie(label='Genre', autopct='%1.0f%%')

Result:


TL;DR

首先,将您的类别列转换为虚拟列:

df = pd.concat([df.drop('genres', axis=1), df.genres.str.get_dummies()], axis=1)

Result:

  movie  a  b  c  d  e  f  g
0     A  1  1  1  0  0  0  0
1     B  0  0  1  0  1  0  0
2     C  0  0  0  0  0  1  1
3     D  1  1  0  1  1  0  0

然后计算每个类别出现的次数:

counts = df.drop('movie', axis=1).sum()

Result:

a    2
b    2
c    2
d    1
e    2
f    1
g    1

最后绘制饼图:

counts.plot.pie()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas:如何绘制 pandas 中 IMDB 电影的电影数量与类型的饼图? 的相关文章

随机推荐

  • JAVAMAIL:AUTH NTLM 失败

    我尝试使用微软交换服务器在本地网络中用java发送电子邮件 这是我的代码 import java io UnsupportedEncodingException import java util Properties import java
  • html2pdf页码编号

    我有这样的代码 html2pdf new HTML2PDF P A4 en html2pdf gt WriteHTML html html2pdf gt Output 如何在文档底部添加页码 我仍在寻找它 我刚刚找到了解决方案 在您的模板中
  • 如何更新 Angular 库项目?

    我有一个使用 Angular 11 版本生成的 Angular 库 现在我想将其更新到 Angular 12 但使用 ng update 命令没有成功 我使用了以下命令 ng update project my lib 上述库已发布在 np
  • 使用 TalkBack 时,Android focusable 和 importantForAccessibility 有什么区别?

    我注意到在很多情况下android importantForAccessibility yes 可以替换为android focusable true 与 TalkBack 的工作方式完全相同 什么时候应该android important
  • 在 dc.js / Crossfilter 中添加过滤器不更新图表

    js小提琴 http jsfiddle net PYeFP http jsfiddle net PYeFP 我设置了一个条形图 用于显示用户每天的出行次数 tripVolume dc barChart trip volume width 9
  • 了解Android webview javascript接口

    我创建了一个安卓WebView 并注入javascript接口使用addJavascriptInterface mObject jsinterface 它工作正常 直到我使用 JavaScript 在 JavaScript 中创建具有相同名
  • :第一个孩子与 ng-repeat

    我有一个 ng repeat 并且只想将样式应用于第一个div与班级type在 ng repeat 中 div class my list div class type span item label span div div class
  • 拖放 imageview android

    我目前正在开发一款游戏 因为有一个框架布局 其中有一个 Horizo ntalView 和一个 VerticalView 和 AbsoluteLayout 而 Absolutelayout 位于右上角 因为有一个 ImageView 现在
  • 如何更改单个表格行的边框颜色?

    我试图通过更改单个行的边框颜色来突出显示该表行 这是我的CSS table border collapse collapse td min width 100px border 1px solid green highlight td bo
  • MVC5 的嵌套布局

    我看过一些关于这个主题的帖子 具有级联部分的 Razor 嵌套布局 https stackoverflow com questions 5525602 razor nested layouts with cascading sections
  • SSRS 与 Crystal Reports [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 控制多个 JMS 队列的消耗

    我在任何地方都找不到这个信息 我有两个队列 JmsListener destination p1 JmsListener destination p2 如何确保我一次只处理 1 条消息 即使我正在监听 2 个队列 以及如何配置对首先从哪个队
  • 在xamarin中创建一个cocossharp项目

    我是xamarin studio的新手 我试图按照官方指南创建一个cocosproject 但是这个文档不是很清楚 我的项目有很多错误 https developer xamarin com guides xamarin forms adv
  • 多个触发器对一个表具有相同的操作时间和事件mysql错误

    我是触发器新手 并且收到 一张表的多个触发器具有相同的操作时间和事件 错误 我创建了一个更新后和删除后 这是两个单独的操作时间 事件 所以我不太确定为什么会收到错误 这是我的查询 CREATE TRIGGER new enrolment A
  • Caret 包 - 定义积极结果

    在使用 Caret 包进行机器学习时 我对 Caret 的默认 正 结果选择感到震惊 即二元分类问题中结果因素的第一级 软件包说它可以设置为替代级别 任何机构可以帮助我定义积极的结果吗 感谢您 看看这个例子 使用混淆矩阵从插入符号示例中扩展
  • 在 Rstudio 的查看器中显示 Rd 文件

    我在项目文件夹中有函数和数据集的文档 在文档文件夹中 我有所有数据集的 Rd 文件 我希望用户能够调用自定义帮助函数并在查看器中启动 Rd 文件 就像从文件编辑器编译文件时自动完成的那样 是否有可能做到这一点 我不太明白你为什么要这样做 但
  • MagicalRecord:多个数据库

    我有一个使用 MagicalRecord 的应用程序 并且我正在使用大量用于参考的数据预先填充数据库 在同一数据模型中 我拥有与用户在应用程序中可能执行的操作相关的用户可定义信息 该应用程序被拒绝 因为预填充的数据应该被标记为 不备份 因此
  • 异常情况下自动回滚有什么缺点?

    当您编写 Flask sqlalchemy 应用程序并进行数据库查询 异常处理时 如下所示 def add user user User gt bool was the user added errors try db session ad
  • 塑料单片机。这是正确的解决方案吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我知道已经有一些关于塑料 SCM 的问题 但它们已经存在一年多了 最近有人用过Plastic SCM吗 你怎么看待这件事 我已经使用过 git
  • pandas:如何绘制 pandas 中 IMDB 电影的电影数量与类型的饼图?

    我有以下数据集 import pandas as pd import numpy as np matplotlib inline df pd DataFrame movie A B C D genres Science Fiction Ro