如何使用 matplotlib 在 python 中绘制 3D 密度图

2024-03-05

我有一个 (x,y,z) 蛋白质位置的大型数据集，并且想将高占用率区域绘制为热图。理想情况下，输出应该类似于下面的体积可视化，但我不确定如何使用 matplotlib 实现这一点。

我最初的想法是将我的位置显示为 3D 散点图，并通过 KDE 对它们的密度进行着色。我用测试数据将其编码如下：

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D 

mu, sigma = 0, 0.1 
x = np.random.normal(mu, sigma, 1000)
y = np.random.normal(mu, sigma, 1000)
z = np.random.normal(mu, sigma, 1000)

xyz = np.vstack([x,y,z])
density = stats.gaussian_kde(xyz)(xyz) 

idx = density.argsort()
x, y, z, density = x[idx], y[idx], z[idx], density[idx]

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(x, y, z, c=density)
plt.show()

这很好用！然而，我的真实数据包含数千个数据点，计算 kde 和散点图变得非常慢。

我的真实数据的一个小样本：

我的研究表明，更好的选择是评估网格上的高斯 kde。我只是不确定如何在 3D 中实现这一点：

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D 

mu, sigma = 0, 0.1 
x = np.random.normal(mu, sigma, 1000)
y = np.random.normal(mu, sigma, 1000)

nbins = 50

xy = np.vstack([x,y])
density = stats.gaussian_kde(xy) 

xi, yi = np.mgrid[x.min():x.max():nbins*1j, y.min():y.max():nbins*1j]
di = density(np.vstack([xi.flatten(), yi.flatten()]))

fig = plt.figure()
ax = fig.add_subplot(111)
ax.pcolormesh(xi, yi, di.reshape(xi.shape))
plt.show()

感谢 mwaskon 推荐 mayavi 库。

我在 mayavi 中重新创建了密度散点图，如下所示：

import numpy as np
from scipy import stats
from mayavi import mlab

mu, sigma = 0, 0.1 
x = 10*np.random.normal(mu, sigma, 5000)
y = 10*np.random.normal(mu, sigma, 5000)
z = 10*np.random.normal(mu, sigma, 5000)

xyz = np.vstack([x,y,z])
kde = stats.gaussian_kde(xyz)
density = kde(xyz)

# Plot scatter with mayavi
figure = mlab.figure('DensityPlot')
pts = mlab.points3d(x, y, z, density, scale_mode='none', scale_factor=0.07)
mlab.axes()
mlab.show()

将scale_mode 设置为“none”可防止字形按密度向量的比例缩放。此外，对于大型数据集，我禁用了场景渲染并使用遮罩来减少点数。

# Plot scatter with mayavi
figure = mlab.figure('DensityPlot')
figure.scene.disable_render = True

pts = mlab.points3d(x, y, z, density, scale_mode='none', scale_factor=0.07) 
mask = pts.glyph.mask_points
mask.maximum_number_of_points = x.size
mask.on_ratio = 1
pts.glyph.mask_input_points = True

figure.scene.disable_render = False 
mlab.axes()
mlab.show()

接下来，评估网格上的高斯 kde：

import numpy as np
from scipy import stats
from mayavi import mlab

mu, sigma = 0, 0.1 
x = 10*np.random.normal(mu, sigma, 5000)
y = 10*np.random.normal(mu, sigma, 5000)    
z = 10*np.random.normal(mu, sigma, 5000)

xyz = np.vstack([x,y,z])
kde = stats.gaussian_kde(xyz)

# Evaluate kde on a grid
xmin, ymin, zmin = x.min(), y.min(), z.min()
xmax, ymax, zmax = x.max(), y.max(), z.max()
xi, yi, zi = np.mgrid[xmin:xmax:30j, ymin:ymax:30j, zmin:zmax:30j]
coords = np.vstack([item.ravel() for item in [xi, yi, zi]]) 
density = kde(coords).reshape(xi.shape)

# Plot scatter with mayavi
figure = mlab.figure('DensityPlot')

grid = mlab.pipeline.scalar_field(xi, yi, zi, density)
min = density.min()
max=density.max()
mlab.pipeline.volume(grid, vmin=min, vmax=min + .5*(max-min))

mlab.axes()
mlab.show()

作为最后的改进，我通过并行调用 kde 函数加快了密度密度函数的评估。

import numpy as np
from scipy import stats
from mayavi import mlab
import multiprocessing

def calc_kde(data):
    return kde(data.T)

mu, sigma = 0, 0.1 
x = 10*np.random.normal(mu, sigma, 5000)
y = 10*np.random.normal(mu, sigma, 5000)
z = 10*np.random.normal(mu, sigma, 5000)

xyz = np.vstack([x,y,z])
kde = stats.gaussian_kde(xyz)

# Evaluate kde on a grid
xmin, ymin, zmin = x.min(), y.min(), z.min()
xmax, ymax, zmax = x.max(), y.max(), z.max()
xi, yi, zi = np.mgrid[xmin:xmax:30j, ymin:ymax:30j, zmin:zmax:30j]
coords = np.vstack([item.ravel() for item in [xi, yi, zi]]) 

# Multiprocessing
cores = multiprocessing.cpu_count()
pool = multiprocessing.Pool(processes=cores)
results = pool.map(calc_kde, np.array_split(coords.T, 2))
density = np.concatenate(results).reshape(xi.shape)

# Plot scatter with mayavi
figure = mlab.figure('DensityPlot')

grid = mlab.pipeline.scalar_field(xi, yi, zi, density)
min = density.min()
max=density.max()
mlab.pipeline.volume(grid, vmin=min, vmax=min + .5*(max-min))

mlab.axes()
mlab.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

matplotlib

scipy

mayavi

kerneldensity

如何使用 matplotlib 在 python 中绘制 3D 密度图的相关文章

str.translate 与 str.replace - 何时使用哪一个？

何时以及为什么使用前者而不是后者反之亦然目前尚不完全清楚为什么有些人使用前者以及为什么有些人使用后者它们有不同的目的 translate只能用任意字符串替换单个字符但一次调用可以执行多次替换它的参数是一个特殊的表它将单个字符映射
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
通过 python 中的另外两个修改数组[重复]

这个问题在这里已经有答案了假设我们有三个一维数组 A 长度为 5 B 长度相同示例中为5 C 更长比如长度为 100 C最初用零填充 A给出索引C应更改的元素它们可能会重复以及B给出应添加到初始零的值C 例如如果A 1 3 3
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
Matplotlib 图例，跨列添加项目而不是向下添加项目

对于下面的简单绘图有没有办法让 matplotlib 填充图例以便它从左到右填充行而不是第一列然后第二列 gt gt gt from pylab import gt gt gt x arange 2 pi 2 pi 0 1 gt gt
带有 mkdocs 的本地 mathjax

我想在无法访问互联网的计算机上使用 MathJax 和 Mkdocs 因此我不能只调用 Mathjax CDN Config mkdocs yml site name My Docs extra javascript javascripts
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
使用 Python 绘制 USGS 水文数据甘特图？

我编译了一个数据帧其中包含几个不同流计的 USGS 流数据现在我想创建一个类似的甘特图this https stackoverflow com questions 31820578 how to plot stacked event d
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

通过 GitHub 发布 Webhook 触发 AWS CodePipeline

AWS CodePipeline 现在支持 GitHub WebHook 但默认情况下每次在主分支上推送更改代码时都会触发 CodePipeline 但是我只希望它在我实际发布版本时运行因此我手动配置了自动生成的 GitHub
设置具有多个值的本地化字符串的格式

我创建了一个本地化字符串其形式类似于 text key Collected d out of d 并使用以下格式化程序 let numberOfItems 2 let totalNumberOfItems 10 let format NS
在R中过滤掉多列

假设一个数据集有多个行和列其中一些列为 0 我的意思是该列中的所有值都是 0 如何过滤掉这些列我已尝试使用以下代码但无济于事 training data lt Filer function x all x 1 99 0 training
Flutter - 轻按时检测 TextField

我在 Windows 中制作了一个 Flutter 应用程序并且一切正常但是当我尝试编译到 iOS 时抛出了意外错误在文本字段中检测到 onTap 不是正确的参数我不知道会发生什么在 Windows 中不会返回此错误反正有人知道
设置输入高度为父级的 100%

我在设置输入键入文本高度以适合 100 的父母时遇到了一些问题 td 高度我什至尝试迭代每个输入并使用 jQuery 手动设置它的高度但这需要相当多的时间我正在处理的网站有很多单元格并且仍然无法在 IE 7 和 8 上工作我有
将表单身份验证添加到 ASP.Net 项目会导致 401.2 未经授权？

我正在尝试将表单身份验证插入到最初使用 VS 2013 和 ASP Net 4 0 使用无身份验证模板创建的 ASP Net 项目中我已遵循 MSDN 上的建议并将其添加到 system web 下的 Web Config 中
添加资源文件到xcode

我正在尝试将一些新的资源文件添加到由另一个人在另一台 Mac 上构建的项目中我认为该项目有前人的规定使用右键单击 gt 将文件添加到 MyProject 不会提供预期的结果编译项目后添加的文件在应用程序中不可见如何在我的项目中添加
最新的 Jersey 示例不起作用

我已经安装了最新版本的球衣捆绑版本 2 13 0 以及该版本的示例然后我尝试了用于测试 Restful 服务 examples helloworld pure jax rs src main java org glassfish je
JavaScript 加载图像的进度

JS 有没有办法在加载图像时获取加载图像的进度我想使用HTML5新的Progress标签来显示加载图像的进度我希望有这样的东西 var someImage new Image someImage onloadprogress funct
MongoDB - 大量 MongoCleaner 线程

不知何故我的 java 应用程序与 mongodb 通信最终产生了大量名为 MongoCleanerXXX 的停放睡眠线程我认为它来自驱动程序其数量约为 600 显然数据库存在一些连接问题在 mongod 重新启动一段时间后确实
我的 httpd.conf 是空的

我最近在 ubuntu 上安装了 apache2 但我有一个问题我的 httpd conf 是空的有人能给我一份 ubuntu 上 apache2 的 httpd conf 的干净副本吗谢谢编辑我看到了你的答案但在 wampse
如何让dput删除多余的数据？

我想要一个 SO 问题的最小可重现代码我一直在使用dput droplevels head df 50 然而 df大约有 4k 条记录看起来像dput正在为每个人打印一些东西我需要在问题中显示两个不同的 df 所以不会让我超过 30
打字稿中具有数据水合/脱水的类

我想分享 React TS 前端和 Node TS 后端之间的 TS 类或接口问题是 TS 类型在编译时被剥离所以当我想将类实例转换为 JSON 时我无法使用它们我想知道是否有任何解决方案可以在静态文件中描述我的对象生成 TS 类
在 .Net 2.0 中对 IList 进行排序的最佳方法是什么？

我有一个IList
当调试器设置为 LLDB 时，Xcode 4 挂起附加到（应用程序名称）

当我在模拟器中运行应用程序时 Xcode 挂在附加到应用程序名称上但这仅在调试器设置为 LLDB 时发生当调试器设置为 GDB 时应用程序运行良好产品 gt 编辑方案 gt 运行 gt 调试器如何修复此问题以使用 LLDB
C static 关键字与 C++ 私有作用域？

本地翻译单元的 C 等效项是什么staticC 中的函数例如有以下内容bar c static void bar 在C 中这会被写成私有成员函数吗 class foo void bar void foo bar 私有成员函数隐式引入了t
用例图包括

我有一个关于用例图的问题如图所示用户可以输入或更新他的姓名和问题正如您所看到的用户在第一次输入信息时需要输入姓名和问题因此包括在内但是如果他希望更新他的信息图表是否表明他必须修改名称和问题因为它们包含在内例如如果他拼错
Economist.com 如何实施其粘性标题？ jQuery？

如果您访问经济学人网站上的一篇文章例如 http www economist com node 17629757 http www economist com node 17629757 当您向下滚动页面超过某个点使用 PAGEDO
如何禁用 <> 的自动关闭而不禁用其他括号 () {}？

我对自动完成的功能感到恼火 lt gt Rust 的 VSCode 中的括号虽然它在指定泛型类型时可能很有用但当它为我的小于运算符自动完成 gt 时它确实让我烦恼我知道我可以完全禁用自动关闭括号但是有没有办法指定其中哪些应该被视为
如何使用 matplotlib 在 python 中绘制 3D 密度图

我有一个 x y z 蛋白质位置的大型数据集并且想将高占用率区域绘制为热图理想情况下输出应该类似于下面的体积可视化但我不确定如何使用 matplotlib 实现这一点我最初的想法是将我的位置显示为 3D 散点图并通过 KDE 对

如何使用 matplotlib 在 python 中绘制 3D 密度图

如何使用 matplotlib 在 python 中绘制 3D 密度图 的相关文章

随机推荐

热门标签

如何使用 matplotlib 在 python 中绘制 3D 密度图的相关文章