Matplotlib 可视化50图：散点图（1）

2023-11-01

导读

本系列将持续更新50个matplotlib可视化示例，主要参考Selva Prabhakaran 在MachineLearning Plus上发布的博文：Python可视化50图。

定义

关联图是查看两个事物之间关系的图像，它能够展示出一个事物随着另一个事物是如何变化的。关联图的类型有：折线图，散点图，相关矩阵等。

散点图

测试

导入需要使用的库

import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns

plt.scatter

#绘制超简单的散点图：变量x1与x2的关系

#定义数据
x1 = np.random.randn(10) #取随机数
x2 = x1 + x1**2 - 10

#确定画布 - 当只有一个图的时候，不是必须存在
plt.figure(figsize=(8,4))

#绘图
plt.scatter(x1,x2 #横坐标，纵坐标
            ,s=50 #数据点的尺寸大小
            ,c="red" #数据点的颜色
            ,label = "Red Points"
           )
#装饰图形
plt.legend() #显示图例

plt.show() #让图形显示

例子

# 除了两列X之外，还有标签y的存在
# 在机器学习中，经常使用标签y作为颜色来观察两种类别的分布的需求

X = np.random.randn(10,2)  # 10行，2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])

colors = ["red","black"]  # 确立颜色列表
labels = ["Zero","One"]  # 确立标签的类别列表

for i in range(X.shape[1]):
    plt.scatter(X[y==i,0],
               X[y==i,1],
               c=colors[i],
               label = labels[i])

# 在标签中存在几种类别，就需要循环几次，一次画一个颜色的点

plt.legend()
plt.show()

实战

数据

# 导入数据
midwest = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")

# 探索数据
midwest.shape  
midwest.head()
midwest.columns

颜色

plt.cm.tab10()

用于创建颜色的十号光谱，在 matplotlib 中，有众多光谱供我们选择：https://matplotlib.org/stable/tutorials/colors/colormaps.html 。可以在plt.cm.tab10()中输入任意浮点数，来提取出一种颜色。光谱tab10中总共只有十种颜色，如果输入的浮点数比较接近，会返回类似的颜色。这种颜色会以元祖的形式返回，表示为四个浮点数组成的RGBA色彩空间或者三个浮点数组成的RGB色彩空间中的随机色彩。

color1 = plt.cm.tab10(5.2)

color1  # 四个浮点数组成的一个颜色

绘图

# 预设图像的各种属性
large = 22; med = 16; small = 12
params = {'axes.titlesize': large,   # 子图上的标题字体大小
          'legend.fontsize': med,   # 图例的字体大小
          'figure.figsize': (16, 10), # 图像的画布大小
          'axes.labelsize': med,   # 标签的字体大小
          'xtick.labelsize': med,  # x轴上的标尺的字体大小
          'ytick.labelsize': med,  # y轴上的标尺的字体大小
          'figure.titlesize': large}  # 整个画布的标题字体大小
plt.rcParams.update(params)  # 设定各种各样的默认属性
plt.style.use('seaborn-whitegrid')  # 设定整体风格
sns.set_style("white")  # 设定整体背景风格

# 准备标签列表和颜色列表
categories = np.unique(midwest['category'])
colors = [plt.cm.tab10(i/float(len(categories)-1)) for i in range(len(categories))]

# 建立画布
plt.figure(figsize=(16, 10)   # 绘图尺寸
           , dpi=100          # 图像分辨率
           , facecolor='w'    # 图像的背景颜色，设置为白色，默认也是白色
           , edgecolor='k'    # 图像的边框颜色，设置为黑色，默认也是黑色
          )

# 循环绘图
for i, category in enumerate(categories):
    plt.scatter('area', 'poptotal', 
                data=midwest.loc[midwest.category==category, :], 
                s=20, c=np.array(colors[i]).reshape(1,-1), label=str(category))

# 对图像进行装饰
# plt.gca() 获取当前的子图，如果当前没有任何子图的话，就创建一个新的子图
plt.gca().set(xlim=(0, 0.12), ylim=(0, 80000))  # 控制横纵坐标的范围
plt.xticks(fontsize=12)  # 坐标轴上的标尺的字的大小
plt.yticks(fontsize=12)
plt.ylabel('Population',fontsize=22)  # 坐标轴上的标题和字体大小
plt.xlabel('Area',fontsize=22)
plt.title("Scatterplot of Midwest Area vs Population", fontsize=22)  # 整个图像的标题和字体的大小
plt.legend(fontsize=12)  # 图例的字体大小
plt.show()

欢迎Star -> 学习目录 <- 点击跳转

国内链接 -> 学习目录 <- 点击跳转

本文由 mdnice 多平台发布

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Matplotlib 可视化50图：散点图（1）的相关文章

Django：模拟模型上的字段

如何将模拟对象分配给该模型上的用户字段无论如何都要绕过 SomeModel user 必须是 User 实例检查吗 class SomeModel models Model user models ForeignKey User 我不会
Python 中的字节数组

如何在 Python 中表示字节数组如 Java 中的 byte 我需要用 gevent 通过网络发送它 byte key 0x13 0x00 0x00 0x00 0x08 0x00 在Python 3中我们使用bytes对象也称为s
切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
PyQt：如何通过匿名代理使用网页

这真让我抓狂我想在 QWebPage 中显示一个 url 但我想通过匿名代理来实现 Code setting up the proxy proxy QNetworkProxy proxy setHostName 189 75 98 199
Kivy - 文本换行工作错误

我正在尝试在 Kivy 1 8 0 应用程序中换行文本当没有太多文字时一切正常但如果文本很长并且窗口不是很大它只是剪切文本这是示例代码 vbox BoxLayout orientation vertical size hint y
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
如何在单元测试中使用 JSON 发送请求

我的 Flask 应用程序中有在请求中使用 JSON 的代码我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好但是我正在尝试使用 Python 的 unittest 模块创建单元测试但
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

Python 基础合集8：类的继承和多态

一前言本小节主要梳理类的继承和多态继承包含三种形式单继承多层继承多重继承环境说明 Python 3 6 windows11 64位二继承基础语法如下 class B A 表示的含义就是B 继承A A 是B 的父类 cla
把数据插入到数据库的两种方法

把表单中的数据插入到数据库中有两种方法 1 直接使用sql语句的优点速度快不耗资源缺点不能传递太长的字段内容字段比较多时不易排错推荐有经验的编程者优先考虑具体操作假设表单中有以下字段 username password s
阿里云免费试用服务器，怎么申请

免费试用也要分个人用户和企业用户个人用户选择比较少目前只有下面这个配置免费试用3个月企业用户有4款机型一参与对象满足以下全部条件的阿里云用户 1 阿里云注册会员用户可以联系我注册账号这样试用以后如果要新购也可以有优惠 2
微信小程序调用天气信息

在微信小程序中调用天气信息下面是示例代码 wx request url example php 仅为示例并非真实的接口地址 data x y header content type application json 默认值 succes
jdk和tomcat的关系

1 什么是jvm 我们从操作系统的层面来理解 jvm其实就是操作系统中的一个进程既然是一个进程那么我们很容易的可以通过任务管理器来查看假设此时我们启动myeclipse myeclipse其实就是用java语言编写的一个软件他的运行
Java定时任务调度工具详解之Quartz篇（中级）一：浅谈JobExecutionContext&JobDatai&浅谈Trigger

概要 OpenSymphony提供的强大的开源任务调度框架官网 http www quartz scheduler org 纯java实现精细控制排程特点强大的调度功能灵活的应用方式分布式和集群能力主要用到的设计模式 Buil
微信小程序+java后台+云服务器开发学习记录

仅作为个人学习记录 1 使用了iview辅助开发 2 开发后台时访问jsp和servlet突然404 检查以后发现8080端口被以前没清理干净的java程序占用了到任务管理器里把java exe干掉以后重启idea一切恢复正常困扰了我
100流明相当于多少w_lx和瓦数换算(1lx等于多少w)

你好别想太多了这个没得换算的所谓能换算的都是已知光效的灯就是每瓦多少流明的然后再通过受照面积换算希望对你有所帮助望采纳白炽灯的瓦数光照强度 10W 65lm 15W 101lm 25W 198lm 40W 340lm 60
身边那些百万年薪的程序员朋友

大家好我是寂小桦争取每周在这里给大家分享自己作为独立开发者经历以及身边程序员朋友的趣事百万年薪是个永远说不烂的话题就在最近的一年仿佛雨后春笋一般身边开始涌现出很多年薪百万的程序员朋友清一色集中在腾讯阿里京东头条这些公司其中一
数字电路的时钟（3）-- 抖动

引言抖动是时钟信号边沿事件的时间点集合相对于其理想值的离散时序变量时钟信号中的抖动通常是由系统中的噪声或其他干扰导致的具体因素包括热噪声电源变化负载条件器件噪声以及相邻电路耦合的干扰等抖动类型时钟信号抖动定义有多种主要是周
IDEA的Junit安装(添加jar包)

1 安装junit插件 1 打开IDEA 点击文件选择设置 setting 2 选择Plugins gt 点击Browse repositories 3 在搜索框中搜索Junit gt 找到Junit Generator V2 0点击 g
我所理解的设计模式（C++实现）——适配器模式（Adapter Pattern）

解决的问题适配器模式把一个类的接口变换成客户端所期待的另一种接口从而使原本接口不匹配而无法在一起工作的两个类能够在一起工作比如说我的hp笔记本美国产品人家美国的电压是110V的而我们中国的电压是220V 要在中国能使用必须找个
java内存管理（堆、栈、方法区）

java内存管理简介首先我们要了解我们为什么要学习java虚拟机的内存管理不是java的gc垃圾回收机制都帮我们释放了内存了吗但是在写程序的过程中却也往往因为不懂内存管理而造成了一些不容易察觉到的内存问题并且在内存问题出现的时候
Android Activity调用Dialog后的返回值方法

这个例子只是简单的返回一个String 而在实际需要时可能需要在DIalog或非Activity 如ListView中的Adapter 中做复杂的操作后返回值至主Activity 例如本人最近在做一个ListView中的Adapter包
软件工程知识体系

三个知识体系知识体系设计知识体系开发知识体系业务知识体系业务知识体系是指需要导入管理信息系统的客户所从事行业的业务知识软件实现的过程是从理解客户业务和相关知识开始的理解和掌握客户业务知识是理解客户需求和优化客户业务的基础个
使用vue+echarts绘制图表

五步绘制echarts图表目录五步绘制echarts图表第一步 main js中添加如下代码第二步 template中添加如下代码第三步 methods中写一个绘制折线图的函数第四步 mounted中调用函数第五步 css中添
python爬取表情包

效果图源代码说明就在注释里 import os import requests from bs4 import BeautifulSoup if not os path exists images os mkdir images hea
linux 堆探索

堆的虚拟地址是连续的是brk来分配 brk是一个指针指向堆顶的指针并且是可以复用的但是只有在堆顶空闲128k时才收缩也就是说为了减少page fault 可重用开销小的特点但是会内存碎片但是分配内存 gt 128k时就是
【无机纳米材料科研制图——3ds Max 0102】3dmax界面及常用功能说明

上一篇中我们以一个核壳纳米粒子的创建直奔主题先入为主开始了3dmax的技术分享此篇我们开始从大局上对3dmax的界面和功能区进行一个说明一界面分布界面常用的主要功能区是下图中的五个当然还有动画视频方面的控制区暂不介绍
Matplotlib 可视化50图：散点图（1）

导读本系列将持续更新50个matplotlib可视化示例主要参考Selva Prabhakaran 在MachineLearning Plus上发布的博文 Python可视化50图定义关联图是查看两个事物之间关系的图像它能够展示出

Matplotlib 可视化50图：散点图（1）

导读

定义

散点图

测试

实战

数据

标签

颜色

绘图

Matplotlib 可视化50图：散点图（1） 的相关文章

随机推荐

热门标签

Matplotlib 可视化50图：散点图（1）的相关文章