【WordCloud】生成词云

2023-05-16

generate_from_frequencies:从频率字典中生成词云

该方法传入统计好的词频字典,例如{'Python': 5, 'Hadoop': 10, 'Spark': 20, '大数据': 5, '人工智能': 2, '数据': 3},然后生成词云。也可以使用collections.Counter()统计列表中出现的词的频率,该方法返回一个字典,例如

import collections

words = ['Python', 'Spark', 'Spark', 'Spark', 'Python', 'Hadoop']
freq = dict(collections.Counter(words))
print(freq)
>>> {'Python': 2, 'Spark': 3, 'Hadoop': 1}
import matplotlib.pyplot as plt
from wordcloud import WordCloud

# 设置格式
wc = WordCloud(width=1024, height=768, background_color='white',
               font_path='STKAITI.TTF', max_font_size=400, random_state=50)
# 从频率字典中生成词云
wc.generate_from_frequencies(
    {'Python': 5, 'Hadoop': 10, 'Spark': 20, '大数据': 5, '人工智能': 2, '数据': 3})
wc.to_file('词云.jpg')
plt.imshow(wc)
plt.show()

在这里插入图片描述

generate或generate_from_text 从字符串中生成词云

该方法需要传入一个字符串,每个词之间用' '空格隔开,

import matplotlib.pyplot as plt
from wordcloud import WordCloud

sentence = '路透社本周早些时候报道,寻求收购 TikTok 的字节跳动投资者对其估值高达500亿美元,\
TikTok在上个月被印度政府封禁后,728日,日本自民党议员联盟也向政府建议禁用TikTok等中国企业App。'
# 删除特殊符号
sentence = re.sub('[\'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘\'![\\]^_`{|}~\s]+', "", sentence)
# jieba中文分词
words = list(jieba.cut(sentence))
# ['路透社', '本周', '早些时候', '报道', '寻求', '收购', 'TikTok', '的', '字节', '跳动', '投资者',
# '对', '其', '估值', '高达', '500', '亿美元', 'TikTok', '在', '上个月', '被', '印度政府', '封禁',
# '后', '7', '月', '28', '日', '日本自民党', '议员', '联盟', '也', '向', '政府', '建议', '禁用',
# 'TikTok', '等', '中国', '企业', 'App']

# 设置格式
wc = WordCloud(width=1024, height=768, background_color='white',
               font_path='STKAITI.TTF', max_font_size=400, random_state=50)
# 用空格隔开每个词
wc.generate_from_text(' '.join(words)) # 或者 wc.generate(' '.join(words))
wc.to_file('词云.jpg')
plt.imshow(wc)
plt.show()

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【WordCloud】生成词云 的相关文章

  • centos下安装chrome

    到网页 https www google cn chrome 点击安装 下载 rpm安装包 安装即可 root 64 localhost 下载 yum localinstall google chrome stable current x8
  • 【双指针】80. 删除排序数组中的重复项 II

    题目 给定一个排序数组 xff0c 你需要在原地删除重复出现的元素 xff0c 使得每个元素最多出现两次 xff0c 返回移除后数组的新长度 不要使用额外的数组空间 xff0c 你必须在原地修改输入数组并在使用 O 1 额外空间的条件下完成
  • 【双指针】27. 移除元素

    题目 给你一个数组 nums 和一个值 val xff0c 你需要 原地 移除所有数值等于 val 的元素 xff0c 并返回移除后数组的新长度 不要使用额外的数组空间 xff0c 你必须仅使用 O 1 额外空间并 原地 修改输入数组 元素
  • 【栈】155. 最小栈

    题目 设计一个支持 push xff0c pop xff0c top 操作 xff0c 并能在常数时间内检索到最小元素的栈 push x 将元素 x 推入栈中 pop 删除栈顶的元素 top 获取栈顶元素 getMin 检索栈中的最小元素
  • 【数组】初始化、获取长度

    初始化 xff0c 获取长度 span class token keyword public span span class token keyword class span span class token class name main
  • 【Stack】简单使用

    入栈 xff1a add获取栈顶元素 xff1a peek出栈 xff1a pop span class token keyword import span java span class token punctuation span ut
  • 【HashMap】基本操作

    添加键值对put获取key对应的value get遍历 xff1a keySet span class token keyword import span java span class token punctuation span uti
  • 【单调栈】496. 下一个更大元素 I

    题目 给定两个 没有重复元素 的数组 nums1 和 nums2 xff0c 其中nums1 是 nums2 的子集 找到 nums1 中每个元素在 nums2 中的下一个比其大的值 nums1 中数字 x 的下一个更大元素是指 x 在 n
  • 【堆】建堆、插入、删除、堆排序

    参考 堆就是利用数组来实现二叉树 xff0c 可用于构建优先队列 堆排序 TopK问题等 可分为 xff1a 最大堆 xff1a 父节点的值比其子节点大最小堆 xff1a 父节点的值比其子节点小 堆的根节点存放了最小 xff08 或最大 x
  • 【RDD编程】cache持久化使用场景

    Spark中RDD采用惰性求值的机制 xff0c 每次遇到action操作都会触发一次从头开始执行的计算 xff0c 在某些场景下这会使得程序性能大幅度降低 例如下面例子 xff0c 在rdd13 count 时将触发一次从rdd1开始到r
  • 【Java】自带sort库使用

    Arrays sort arr span class token keyword public span span class token keyword class span span class token class name mai
  • 如何使UDEV规则有效

    转 victor 64 X301A1 ls etc udev rules d 70 persistent cd rules 70 persistent net rules README 然后 xff1a victor 64 X301A1 s
  • 【堆】剑指 Offer 40. 最小的k个数

    输入整数数组 arr xff0c 找出其中最小的 k 个数 例如 xff0c 输入4 5 1 6 2 7 3 8这8个数字 xff0c 则最小的4个数字是1 2 3 4 示例 1 xff1a 输入 xff1a arr 61 3 2 1 k
  • 【堆】703. 数据流中的第K大元素

    设计一个找到数据流中第K大元素的类 xff08 class xff09 注意是排序后的第K大元素 xff0c 不是第K个不同的元素 你的 KthLargest 类需要一个同时接收整数 k 和整数数组nums 的构造器 xff0c 它包含数据
  • 【Queue】简单使用

    java中LinkedList实现了Queue接口 xff0c 可以当作队列使用 添加元素 xff1a offer或add方法 xff0c add方法在失败的时候会抛出异常 不推荐 删除元素 xff1a remove和poll方法都是从队列
  • 【树】剑指 Offer 55 - I. 二叉树的深度

    题目 输入一棵二叉树的根节点 xff0c 求该树的深度 从根节点到叶节点依次经过的节点 xff08 含根 叶节点 xff09 形成树的一条路径 xff0c 最长路径的长度为树的深度 例如 xff1a 给定二叉树 span class tok
  • 【树】剑指 Offer 28. 对称的二叉树

    题目 请实现一个函数 xff0c 用来判断一棵二叉树是不是对称的 如果一棵二叉树和它的镜像一样 xff0c 那么它是对称的 例如 xff0c 二叉树 1 2 2 3 4 4 3 是对称的 span class token number 1
  • 【图】1042. 不邻接植花

    题目 有 N 个花园 xff0c 按从 1 到 N 标记 在每个花园中 xff0c 你打算种下四种花之一 paths i 61 x y 描述了花园 x 到花园 y 的双向路径 另外 xff0c 没有花园有 3 条以上的路径可以进入或者离开
  • 【LinkedList】基本操作、图的邻接表

    基本操作 创建 LinkedList span class token generics function span class token punctuation lt span Integer span class token punc
  • 【Python】配置文件configparser

    使用configparser模块读取模型参数 xff0c 设置config ini文件内容如下 xff0c train 和 savepath 分别为两个session span class token punctuation span tr

随机推荐

  • 【Python】生成随机字符串

    参考 span class token keyword import span random span class token keyword def span span class token function random str sp
  • 【动态规划】64. 最小路径和

    题目 给定一个包含非负整数的 m x n 网格 xff0c 请找出一条从左上角到右下角的路径 xff0c 使得路径上的数字总和为最小 说明 xff1a 每次只能向下或者向右移动一步 示例 输入 1 3 1 1 5 1 4 2 1 输出 7
  • 树莓派无法安装pyqt5与pandas

    问题描述 使用pip3 install安装一些包 xff0c 例如pyqt5 pandas无法成功 sudo pip3 install pandas sudo pip3 install pyqt5 无法安装 解决方案 xff1a 安装pan
  • 【Java】二维数组初始化

    带值初始化 span class token keyword int span a span class token punctuation span span class token punctuation span span class
  • 【图】1162. 地图分析(多源BFS)

    题目 你现在手里有一份大小为 N x N 的 地图 xff08 网格 xff09 grid xff0c 上面的每个 区域 xff08 单元格 xff09 都用 0 和 1 标记好了 其中 0 代表海洋 xff0c 1 代表陆地 xff0c
  • 【tensorflow】数据增强

    使用tf image对图片进行数据增强 读入图片 span class token keyword from span PIL span class token keyword import span Image span class to
  • 【HashMap】使用自定义类作为key

    需要重写hashCode 和equals 方法才能实现自定义键在HashMap中的查找 span class token keyword class span span class token class name Pos span spa
  • 【图】1267. 统计参与通信的服务器

    题目 这里有一幅服务器分布图 xff0c 服务器的位置标识在 m n 的整数矩阵网格 grid 中 xff0c 1 表示单元格上有服务器 xff0c 0 表示没有 如果两台服务器位于同一行或者同一列 xff0c 我们就认为它们之间可以进行通
  • 【并查集】Java实现

    并查集理解 并查集的数据结构实现一般是数组 xff0c 通过数组来指示各个元素之间的父子关系 xff0c 通常初始化为 1 xff0c 若最终该位置的值大于0 xff0c 则表示该位置是一个孩子 xff0c 其父亲为节点的值 并查集的两个重
  • 【并查集】721. 账户合并

    题目 给定一个列表 accounts xff0c 每个元素 accounts i 是一个字符串列表 xff0c 其中第一个元素 accounts i 0 是 名称 name xff0c 其余元素是 emails 表示该帐户的邮箱地址 现在
  • 【并查集】面试题 17.07. 婴儿名字

    题目 每年 xff0c 政府都会公布一万个最常见的婴儿名字和它们出现的频率 xff0c 也就是同名婴儿的数量 有些名字有多种拼法 xff0c 例如 xff0c John 和 Jon 本质上是相同的名字 xff0c 但被当成了两个名字公布出来
  • 【Java】字符串比较compareTo

    根据字典序比较两个字符串的大小 xff0c 使用compareTo方法 xff0c 如下 xff0c 如果字符串str1和str2相等则res 61 0 xff0c 若str1字典序小于str2则res lt 0 xff0c 否则res g
  • 【Java】String indexOf substring截取字符串

    使用indexOf char c 方法获取字符串中第一次出现字符c的下标 xff0c 例如 span class token keyword public span span class token keyword class span s
  • 树莓派3B+环境搭建

    转载 xff1a https blog csdn net zhangjun62 article details 80517176 我的树莓派3b 43 没有买HDMI 屏 xff0c 利用网线与电脑主机相连操纵树莓派 如果买回来接上电 xf
  • 【Scala】创建整型数组

    var res span class token operator 61 span new ArrayBuffer span class token punctuation span Int span class token punctua
  • 【RDD编程】map和mapPartitions

    map和mapPartitions map针对RDD中的每一个元素调用一次函数 xff0c 而mapPartitions针对RDD中每个Partition调用一次函数 xff0c 假设RDD有N个元素 xff0c 有M个分区 xff0c 那
  • 【Spark入门项目】词频统计

    项目要求 要求统计txt英文文件中每个单词出现的次数 txt文件内随机拷贝英文内容 xff0c 如下 The scientists re analysed a sample collected by NASA astronauts duri
  • 【jieba】中文分词

    span class token keyword import span jieba words span class token operator 61 span jieba span class token punctuation sp
  • 【Python】读取中文

    fn span class token operator 61 span span class token builtin open span span class token punctuation span path span clas
  • 【WordCloud】生成词云

    generate from frequencies xff1a 从频率字典中生成词云 该方法传入统计好的词频字典 xff0c 例如 39 Python 39 5 39 Hadoop 39 10 39 Spark 39 20 39 大数据 3