Seaborn 直方图与大数据

2024-04-19

我正在尝试绘制 300 万行大数据集的漂亮直方图(我有 2CPU/16GB RAM)。尽管我提供了垃圾箱,但我从未得到过任何线索。有没有更有效的方法来绘制直方图?请参阅下面的代码。

df0 = dd.read_csv(filename, sep="|", header=None, dtype=np.str, error_bad_lines=False, usecols=col0, quoting=3, encoding='ISO-8859-1')
dfs = df0[df0['DocumentTypeStndCode']=='D'].compute()
dfs['Price'] = dfs[pd.to_numeric(dfs['Price'], errors='coerce').notnull()]

sns.distplot(dfs['Price'], bins=[0, 10000, 200000, 400000, 2000000], kde=False)
plt.show()

这对你来说不应该是问题。我展示了几秒钟的时间来生成给定 5000 万行的绘图。我首先尝试了pandas hist。

import pandas as pd
import numpy as np
%matplotlib inline
df = pd.DataFrame({
  'values': np.random.beta(0.5, 0.1, size=50000000)
})
hist = df.hist(bins=10)

和seaborn一样

import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

sns.distplot(df['values'], bins=[0, .10000, .200000, .400000, 2.000000], kde=False)
plt.show()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Seaborn 直方图与大数据 的相关文章

随机推荐

  • 符号被认为是标识符,而不是运算符

    我想实现一个在我的软件中使用的货币运算符 它接受 Double 并返回货币类型以进行更精确的计算 自定义运算符的代码基本上看起来有点像这样 请忽略这种形式中明显的精度下降以及因此无用的运算符 postfix operator postfix
  • 为 Phusion Passenger 应用程序设置环境变量

    我已经在开发中设置了 Passenger Mac OS X 并且它运行完美 后来唯一的问题来了 现在我有一个自定义的GEM HOME路径和 ImageMagick 二进制文件安装在 usr local 我可以将它们放入获取源的 shell
  • regexp_split_to_table 和 row_number

    我有一个包含字符串数据的表 如下所示 id string data 1 red green blue 2 orange 3 purple cyan 我需要将字符串数据拆分为具有行号的项目 id num item 1 1 red 1 2 gr
  • Chrome 在调整大小时无法正确更新背景大小渐变

    虽然 Firefox 正确地做到了这一点 但更新了linear gradient每一帧上的背景 chrome 似乎都会以 跳跃 的方式渲染事物 这意味着它只会在调整大小后每隔几个像素渲染一次数学上正确的布局 演示游乐场 http jsbin
  • 如何使用 Haskell 创建符号链接?

    如何使用 Haskell 创建符号链接 这directory据我所知 包没有提供一种方法来做到这一点 Creating a symbolic link is non portable For example the creation sym
  • 当记录处理时间超过“max.poll.interval.ms”时,在消费过程中记录/消息会发生什么?

    我的消费者设置如下 auto offset reset earliest enable auto commit true default value session timeout ms 10000 default value max po
  • 如何让 nginx 和乘客在部署后自动重启

    我目前在虚拟专用服务器上部署了一个 Rails 应用程序 我使用 Capistrano Nginx 和乘客在服务器上运行我的 Rails 应用程序 由于某种原因 在完成 cap 部署 更新后 我永远无法在网站上显示更新的代码 部署进行得很好
  • 使用 Zeep 解析 WSDL

    我想用 Zeep 解析 WSDL 文件并退出 所有操作 为每个操作请求 xml 消息 有解析 wsdl 的例子吗 我想我应该使用 zeep wsdl 和 parse service 方法 A updated import operator
  • JPA Criteria API:用于可选关系的 LEFT JOIN

    我基本上是第一次使用 Criteria API 这是关于抽象通用构建器的查询 public TypedQuery
  • 如何在 Akka.NET 中使用 TestKit

    我正在尝试测试我的 Akka NET Actor 但在使用 TestKit 和理解它的工作原理时遇到了一些问题 由于 Akka NET 中还没有关于单元测试的官方文档 我已经探索了 Akka NET 存储库中的示例代码 但那里使用的示例对我
  • Logstash 错误 Java::JavaLang::NoClassDefFoundError 无法解决

    我是elasticsearch ES 和logstash 的新手 我已经使用它成功设置了elasticsearch和kibanalink https www youtube com watch v hVgrXi 9L6Y 之后我尝试使用lo
  • 如何在谷歌自定义菜单中制作图标[重复]

    这个问题在这里已经有答案了 在 Google 应用程序中 文档 表格等 是否可以使自定义菜单中的图标与插入菜单中的图标相似 如果是这样我该怎么办 html 服务 图表 链接 图像旁边 甚至粗体 斜体等旁边的内容 Thanks 没有公开的方法
  • 如何将秒转换为 hhmmss

    我到处寻找将秒转换为 hh mm ss 但找不到合适的 我创建了一个程序 允许用户输入两个不同的时间 然后计算差异 输入的时间以 hh 3600 mm 60 ss 分割 然后转换为秒并相互减去以计算秒差 例如 12 12 12 和 13 1
  • 如何确定两个泛型类型值是否相等?

    Update 我很抱歉 我的示例代码包含一个错误 导致很多我不理解的答案 代替 Console WriteLine 3 this Equals go1 Equals go2 我本来想写 Console WriteLine 3 this Eq
  • 更改 Android 操作栏菜单项的点击图标

    我正在使用 Sherlock 操作栏 我的操作栏上有 2 个项目 当选择该项目 活动 时 我想更改图标的图像 这是我的Java代码 Override public boolean onPrepareOptionsMenu Menu menu
  • Jquery - DataTables [tableTools]:仅导出可见行

    我刚刚开始使用 jQuery DataTables 使用DataTables的tableTools 是否可以仅导出可见行而不是所有行 例如 如果分页设置为 10 我预计只会导出 10 行 搜索结果也是如此 这是代码的一部分 document
  • BMP280 ServiceSpecificException:I/O 错误(代码 5)

    我尝试使用 AndroidThings 来测量 Raspberry Pi 3 和 BMP280 的温度 我选择3 3V是因为BMP280规格 https learn adafruit com adafruit bmp280 barometr
  • 如何将可以为 null 的值或数组隐式包装到 Scala 选项中

    我在 Jar 文件中包含这个 Java 类 作为 Scala 程序的依赖项 如 Axis jar class MyClass private String someStrings public String getSomeStrings r
  • 将 OnItemSelectedListener 添加到 Spinner

    我有一个按钮和一个微调器 最初是隐藏的 当用户按下按钮时 微调器会填充项目并变得可见 现在我想将 OnItemSelectedListener 添加到微调器中 我尝试了很多教程但没有运气 这是我的 OnCreate 函数 public vo
  • Seaborn 直方图与大数据

    我正在尝试绘制 300 万行大数据集的漂亮直方图 我有 2CPU 16GB RAM 尽管我提供了垃圾箱 但我从未得到过任何线索 有没有更有效的方法来绘制直方图 请参阅下面的代码 df0 dd read csv filename sep he