python基础----08-----json、pyecharts模块介绍以及折线图、地图、柱状图的绘制

2023-11-10

一 python变量和json数据的相互转化

json就是一种在各个编程语言中流通的数据格式，负责不同编程语言中的数据传递和交互、类似于:
国际通用语言 -英语。

在这里插入图片描述

import json
if __name__ == '__main__':
    # 1. 将python变量转成json(列表->json)
    # 准备列表，列表内每一个元素都是字典，将其转换为JSON
    data = [{"name": "张大山", "age": 11}, {"name": "王大锤", "age": 13}, {"name": "赵小虎", "age": 16}]
    json_str = json.dumps(data)
    print(type(json_str))#<class 'str'>
    print(json_str)
    json_str = json.dumps(data, ensure_ascii = False)
    print(json_str)

    print("====================================")

    # 2. 将python变量转成json(字典->json)
    # 准备字典，将字典转换为JSON
    d = {"name": "周杰轮", "addr": "台北"}
    json_str = json.dumps(d, ensure_ascii = False)
    print(type(json_str))#<class 'str'>
    print(json_str)

    print("====================================")

    # 3. 将json转成python变量(json(实际是字符串)->列表)
    s = '[{"name": "张大山","age": 11}, {"name": "王大锤", "age": 13}, {"name": "赵小虎", "age": 16}]'
    l = json.loads(s)
    print(type(l))#<class 'list'>
    print(l)

    print("====================================")

    # 4. 将json转成python变量(json(实际是字符串)->字典)
    # 这里与第3点区别是,3无法直接转字典,而4能够直接转字典,所以4优先转成字典
    s = '{"name": "周杰轮", "addr": "台北"}'
    d = json.loads(s)
    print(type(d))#<class 'dict'>
    print(d)

在这里插入图片描述

二 pyecharts模块简介

pyecharts模块：如果想要做出数据可视化效果图，可以借助pyecharts模块来完成。
概况：
Echarts是个由百度开源的数据可视化，凭借着良好的交互性，精巧的图表设计，得到了众多开发者的认可.而Python是门富有表达力的语言，很适合用于数据处理.当数据分析遇上数据可视化时pyecharts诞生了。

官网：pyecharts.org。
可以选择语言进行查看pyecharts的文档。
在这里插入图片描述
pyecharts还有一个画廊功能：gallery.pyecharts.org。
pyecharts模块的安装：

pip install pyecharts

三 pyecharts的入门使用

pyecharts有哪些配置选项。
pyecharts模块中有很多的配置选项，常用到2个类别的选项:

全局配置选项(这里会用到)。set_global_opts，就是帮我们设置标题等内容。
系列配置选项。

from pyecharts.charts import Line
from  pyecharts.options import TitleOpts
from  pyecharts.options import LegendOpts
from  pyecharts.options import ToolboxOpts
from  pyecharts.options import VisualMapOpts
if __name__ == '__main__':
    # 导包，导入Line功能构建折线图对象

    # 得到折线图对象
    line = Line()
    # 添加x轴数据
    line.add_xaxis(["中国", "美国", "英国"])
    # 添加y轴数据
    line.add_yaxis("GDP", [30, 20, 10])

    line.set_global_opts(
        title_opts=TitleOpts(True, "GDP展示", pos_left= "center", pos_bottom = "1%"),   #添加标题
        legend_opts=LegendOpts(is_show=True),#添加图例
        toolbox_opts=ToolboxOpts(is_show=True),#添加工具箱
        visualmap_opts=VisualMapOpts(is_show=True)

    )

    # 生成图表
    line.render()

运行后会生成render.html，我们双击打开它。
在这里插入图片描述
然后在pycharm右上角选择浏览器打开。

在这里插入图片描述
图例的意思可以看Echarts legend属性使用理解。

四数据准备

请自行找资料，或者找我。

五生成折线图

首先打开网页http://www.ab173.com/gongju/json/jsonviewernew.php。通过它我们方便观察长json串的视图，方便在代码取数据。
以美国.txt为例，将所有内容拷贝到上面的网站，
然后：
去掉开头的内容：

jsonp_1629344292311_69436(

在这里插入图片描述
去掉末尾的两个元素：

);

在这里插入图片描述

然后选择格式化，数据变成下图。
在这里插入图片描述

再选择视图，就是下图，这样我们就方便观察json数据了。
在这里插入图片描述

当然，如果你眼力好，可以直接看美国.txt的内容，然后在代码中操作，但是不建议，因为直接看这么长的字符串是很难的。

代码：

"""
演示可视化需求1：折线图开发
"""
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts, LabelOpts

# 处理数据
# 1. 读取数据
f_us = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/折线图数据/美国.txt", "r", encoding="UTF-8")
us_data = f_us.read()   # 美国的全部内容

f_jp = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/折线图数据/日本.txt", "r", encoding="UTF-8")
jp_data = f_jp.read()   # 日本的全部内容

f_in = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/折线图数据/印度.txt", "r", encoding="UTF-8")
in_data = f_in.read()   # 印度的全部内容

# 2. 去掉开头和结尾的非json内容
# 去掉不合JSON规范的开头(这是它自己加的,一般实际开发只有纯json串)
us_data = us_data.replace("jsonp_1629344292311_69436(", "")
jp_data = jp_data.replace("jsonp_1629350871167_29498(", "")
in_data = in_data.replace("jsonp_1629350745930_63180(", "")
# 去掉不合JSON规范的结尾(这是它自己加的,一般实际开发只有纯json串)
# -2 代表去掉末尾的最后两个元素，因为切片不包括末尾的下标
us_data = us_data[:-2]
jp_data = jp_data[:-2]
in_data = in_data[:-2]

# 3. JSON转Python字典
us_dict = json.loads(us_data)
jp_dict = json.loads(jp_data)
in_dict = json.loads(in_data)

# 4. 获取trend key
us_trend_data = us_dict['data'][0]['trend']
jp_trend_data = jp_dict['data'][0]['trend']
in_trend_data = in_dict['data'][0]['trend']
print(f"trend key数据类型: {type(us_trend_data)}")# trend key数据类型: <class 'dict'>

# 获取日期数据，用于x轴，取2020年（到314下标结束）
us_x_data = us_trend_data['updateDate'][:314]
jp_x_data = jp_trend_data['updateDate'][:314]
in_x_data = in_trend_data['updateDate'][:314]
print(f"updateDate数据类型: {type(us_x_data)}")# us_x_data数据类型: <class 'list'>

# 获取确认数据，用于y轴，取2020年（到314下标结束. 实际好像不是314,我不太确定它那个数字的含义例如20462501,不过我们不关注）
us_y_data = us_trend_data['list'][0]['data'][:314]
jp_y_data = jp_trend_data['list'][0]['data'][:314]
in_y_data = in_trend_data['list'][0]['data'][:314]
print(f"y轴数据类型: {type(us_y_data)}")# y轴数据类型: <class 'list'>

# 生成图表
line = Line()       # 构建折线图对象
# 添加x轴数据
line.add_xaxis(us_x_data)   # x轴是公用的，所以使用一个国家的数据即可
# 添加y轴数据
# label_opts=LabelOpts(is_show=False)的作用是去掉折线图的数字,避免影响观看
line.add_yaxis("美国确诊人数", us_y_data, label_opts=LabelOpts(is_show=False))     # 添加美国的y轴数据
line.add_yaxis("日本确诊人数", jp_y_data, label_opts=LabelOpts(is_show=False))     # 添加日本的y轴数据
line.add_yaxis("印度确诊人数", in_y_data, label_opts=LabelOpts(is_show=False))     # 添加印度的y轴数据

# 设置全局选项
line.set_global_opts(
    # 标题设置
    title_opts=TitleOpts(title="2020年美日印三国确诊人数对比折线图", pos_left="center", pos_bottom="1%")
)

# 调用render方法，生成图表
line.render()
# 关闭文件对象
f_us.close()
f_jp.close()
f_in.close()

结果：
在这里插入图片描述

取数据对应视图：
在这里插入图片描述

下图实际好像不是314，我不太确定它那个数字的含义，例如20462501，不过我们不关注，因为实际开发时我们肯定知道对应的年份数据。
在这里插入图片描述

六数据可视化案例-基础地图使用

"""
演示地图可视化的基本使用
"""
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts

# 准备地图对象
map = Map()
# 准备数据
data = [
#     ("北京", 99),
#     ("上海", 199),
#     ("湖南", 299),
#     ("台湾", 399),
#     ("广东", 499)
# ]
data = [
    ("北京市", 99),
    ("上海市", 199),
    ("湖南省", 299),
    ("台湾省", 399),
    ("广东省", 499)
]
# 添加数据(data是列表，元素是元祖)
map.add("测试地图", data, "china")

# 设置全局选项
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min": 1, "max": 9, "label": "1-9", "color": "#CCFFFF"},
            {"min": 10, "max": 99, "label": "10-99", "color": "#FF6666"},
            {"min": 100, "max": 500, "label": "100-500", "color": "#990033"}
        ]
    )
)

# 绘图
map.render("基础地图.html")

在这里插入图片描述

注意，如果data的省或者直辖市不改成和地图一样的名字，是没有颜色的。
在这里插入图片描述

七全国疫情地图构建

"""
演示全国疫情可视化地图开发
"""
import json
from pyecharts.charts import Map
from pyecharts.options import *

# 1. 读取数据文件
f = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/地图数据/疫情.txt", "r", encoding="UTF-8")
data = f.read()     # 全部数据
# 关闭文件
f.close()

# 2. 取到各省数据
# 将字符串json转换为python的字典
data_dict = json.loads(data)        # 基础数据字典
# 从字典中取出省份的数据
province_data_list = data_dict["areaTree"][0]["children"]

# 处理省份名字，我们的province_name变量必须要与地图的名字匹配，否则不显示颜色.
def handle_pro_name(name):
    tmp = None
    if name == "上海":
        tmp = "上海市"
    elif name == "香港":
        tmp = "香港特别行政区"
    elif name == "天津":
        tmp = "天津市"
    elif name == "北京":
        tmp = "北京市"
    elif name == "广西":
        tmp = "广西壮族自治区"
    elif name == "重庆":
        tmp = "重庆市"
    elif name == "澳门":
        tmp = "澳门特别行政区"
    elif name == "内蒙古":
        tmp = "内蒙古自治区"
    elif name == "宁夏":
        tmp = "宁夏回族自治区"
    elif name == "西藏":
        tmp = "西藏自治区"
    elif name == "新疆":
        tmp = "新疆维吾尔自治区"
    else:
        tmp = name + "省"
    return tmp

# 3. 组装每个省份和确诊人数为元组，并各个省的数据都封装入列表内
data_list = []      # 绘图需要用的数据列表
for province_data in province_data_list:
    province_name = province_data["name"]                   # 省份名称
    province_name = handle_pro_name(province_name)
    province_confirm = province_data["total"]["confirm"]    # 确诊人数
    data_list.append((province_name, province_confirm))     # 上节说过,map.add要的是列表，列表的元素是元祖
    #print((province_name, province_confirm))

# 4. 创建地图对象
map = Map()

# 5. 添加数据
map.add("各省份确诊人数", data_list, "china")

# 6. 设置全局配置，定制分段的视觉映射
map.set_global_opts(
    title_opts=TitleOpts(title="全国疫情地图"),
    visualmap_opts=VisualMapOpts(
        is_show=True,           # 是否显示
        is_piecewise=True,      # 是否分段
        pieces=[
            {"min": 1, "max": 99, "lable": "1~99人", "color": "#CCFFFF"},
            {"min": 100, "max": 999, "lable": "100~9999人", "color": "#FFFF99"},
            {"min": 1000, "max": 4999, "lable": "1000~4999人", "color": "#FF9966"},
            {"min": 5000, "max": 9999, "lable": "5000~99999人", "color": "#FF6666"},
            {"min": 10000, "max": 99999, "lable": "10000~99999人", "color": "#CC3333"},
            {"min": 100000, "lable": "100000+", "color": "#990033"},
        ]
    )
)

# 7. 绘图
map.render("全国疫情地图.html")

结果：
这里注意，新版本的pyecharts(也可能是python解释器的版本)的地图名字，如果和代码中的province_name值不一样，会无法显示颜色，所以我自行加了一个函数handle_pro_name进行处理。
在这里插入图片描述

province_data_list = data_dict[“areaTree”][0][“children”]的结构：
在这里插入图片描述

province_data的结构：
在这里插入图片描述

八河南省疫情地图绘制

"""
演示河南省疫情地图开发
"""
import json
from pyecharts.charts import Map
from pyecharts.options import *

# 读取文件
f = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/地图数据/疫情.txt", "r", encoding="UTF-8")
data = f.read()
# 关闭文件
f.close()

# 获取河南省数据
# json数据转换为python字典
data_dict = json.loads(data)
# 取到河南省数据
cities_data = data_dict["areaTree"][0]["children"][3]["children"]

# 准备数据为元组并放入list
data_list = []
for city_data in cities_data:
    city_name = city_data["name"] + "市"
    city_confirm = city_data["total"]["confirm"]
    data_list.append((city_name, city_confirm))

# 手动添加济源市的数据，因为疫情.txt没有
data_list.append(("济源市", 5))

# 构建地图
map = Map()
map.add("河南省疫情分布", data_list, "河南")
# 设置全局选项
map.set_global_opts(
    title_opts=TitleOpts(title="河南省疫情地图"),
    visualmap_opts=VisualMapOpts(
        is_show=True,           # 是否显示
        is_piecewise=True,      # 是否分段
        pieces=[
            {"min": 1, "max": 99, "lable": "1~99人", "color": "#CCFFFF"},
            {"min": 100, "max": 999, "lable": "100~9999人", "color": "#FFFF99"},
            {"min": 1000, "max": 4999, "lable": "1000~4999人", "color": "#FF9966"},
            {"min": 5000, "max": 9999, "lable": "5000~99999人", "color": "#FF6666"},
            {"min": 10000, "max": 99999, "lable": "10000~99999人", "color": "#CC3333"},
            {"min": 100000, "lable": "100000+", "color": "#990033"},
        ]
    )
)

# 绘图
map.render("河南省疫情地图.html")


结果：

在这里插入图片描述

九基础柱状图构建

"""
演示基础柱状图的开发
"""
from pyecharts.charts import Bar
from pyecharts.options import LabelOpts
# 使用Bar构建基础柱状图
bar = Bar()
# 添加x轴的数据
bar.add_xaxis(["中国", "美国", "英国"])
# 添加y轴数据
bar.add_yaxis("GDP", [30, 20, 10], label_opts=LabelOpts(position="right"))
# 反转x和y轴
bar.reversal_axis()
# 绘图
bar.render("基础柱状图.html")

# 反转x轴和y轴

# 设置数值标签在右侧

翻转时(调用bar.reversal_axis())：
在这里插入图片描述

不翻转时：
但是不翻转的话，我们看到柱状图右边30，20，10，没有放在柱状图的顶部，所以我们建议翻转一下。
在这里插入图片描述

十基础时间线柱状图绘制

"""
演示带有时间线的柱状图开发
"""
from pyecharts.charts import Bar, Timeline
from pyecharts.options import LabelOpts
from pyecharts.globals import ThemeType

bar1 = Bar()
bar1.add_xaxis(["中国", "美国", "英国"])
bar1.add_yaxis("GDP", [30, 30, 20], label_opts=LabelOpts(position="right"))
bar1.reversal_axis()

bar2 = Bar()
bar2.add_xaxis(["中国", "美国", "英国"])
bar2.add_yaxis("GDP", [50, 50, 50], label_opts=LabelOpts(position="right"))
bar2.reversal_axis()

bar3 = Bar()
bar3.add_xaxis(["中国", "美国", "英国"])
bar3.add_yaxis("GDP", [70, 60, 60], label_opts=LabelOpts(position="right"))
bar3.reversal_axis()

# 构建时间线对象
# theme可以修改柱的颜色
timeline = Timeline({"theme": ThemeType.LIGHT})
# 在时间线内添加柱状图对象
timeline.add(bar1, "点1")
timeline.add(bar2, "点2")
timeline.add(bar3, "点3")

# 自动播放设置
timeline.add_schema(
    play_interval=1000,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=True
)

# 绘图是用时间线对象绘图，而不是bar对象了
timeline.render("基础时间线柱状图.html")

我们看到，下图实际上会根据时间线进行滚动。
在这里插入图片描述

十一动态GDP柱状图绘制

"""
演示第三个图表：GDP动态柱状图开发
"""
from pyecharts.charts import Bar, Timeline
from pyecharts.options import *
from pyecharts.globals import ThemeType

# 1. 读取数据
f = open("C:/Users/Administrator/Desktop/Py/资料/可视化案例数据/动态柱状图数据/1960-2019全球GDP数据.csv", "r", encoding="GB2312")
data_lines = f.readlines()
# 关闭文件
f.close()

# 2. 删除第一条数据(第一条是无用的内容year,GDP,rate标志)
data_lines.pop(0)

# 3. 将数据转换为字典存储，格式为：
# { 年份: [ [国家, gdp], [国家,gdp], ......  ], 年份: [ [国家, gdp], [国家,gdp], ......  ], ...... }
# { 1960: [ [美国, 123], [中国,321], ......  ], 1961: [ [美国, 123], [中国,321], ......  ], ...... }
# 先定义一个字典对象
data_dict = {}
for line in data_lines:
    year = int(line.split(",")[0])      # 年份
    country = line.split(",")[1]        # 国家
    gdp = float(line.split(",")[2])     # gdp数据,加上float是为了将带有科学计数法(5.433E+11)的转成正常的数值
    # 如何判断字典里面有没有指定的key呢？ 通过异常
    try:
        data_dict[year].append([country, gdp])
    except KeyError:
        data_dict[year] = []
        data_dict[year].append([country, gdp])
# print(data_dict[1960])

# 4. 创建时间线对象
timeline = Timeline({"theme": ThemeType.LIGHT})

# 5. 排序年份
sorted_year_list = sorted(data_dict.keys())

# 6. 将每一年的数据创建成对应的bar，然后每个bar都添加到时间线.
for year in sorted_year_list:
    data_dict[year].sort(key=lambda element: element[1], reverse=True) # 将年份里的列表按照gdp值大小进行排序
    year_data = data_dict[year][0:8] # 取出本年份前8名的国家和gdp
    x_data = []
    y_data = []
    for country_gdp in year_data:
        x_data.append(country_gdp[0])   # x轴添加国家
        y_data.append(country_gdp[1] / 100000000)   # y轴添加gdp数据

    # 构建柱状图
    bar = Bar()
    # 将x轴的国家排序翻转,以及将y轴的gdp数据翻转，是为了gdp高的放在柱状图最上面，gdp低的放在最下面
    x_data.reverse()
    y_data.reverse()
    # 添加x轴和y轴到柱状图.
    bar.add_xaxis(x_data)
    bar.add_yaxis("GDP(亿)", y_data, label_opts=LabelOpts(position="right")) # position="right"的作用是将便签放在右边
    # 反转x轴和y轴(上面是将内容翻转，这里是单纯的x轴和y轴调换)
    bar.reversal_axis()

    # 动态设置每一年的图表的标题
    bar.set_global_opts(
        title_opts=TitleOpts(title=f"{year}年全球前8GDP数据")
    )
    # 添加每一年的柱状图到时间线
    timeline.add(bar, str(year))

# 7. 设置时间线自动播放
timeline.add_schema(
    play_interval=1000,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=False
)

# 8. 绘图
timeline.render("1960-2019全球GDP前8国家.html")

结果：
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)