【WordCloud】生成词云

2023-05-16

generate_from_frequencies：从频率字典中生成词云

该方法传入统计好的词频字典，例如{'Python': 5, 'Hadoop': 10, 'Spark': 20, '大数据': 5, '人工智能': 2, '数据': 3}，然后生成词云。也可以使用collections.Counter()统计列表中出现的词的频率，该方法返回一个字典，例如

import collections

words = ['Python', 'Spark', 'Spark', 'Spark', 'Python', 'Hadoop']
freq = dict(collections.Counter(words))
print(freq)
>>> {'Python': 2, 'Spark': 3, 'Hadoop': 1}

import matplotlib.pyplot as plt
from wordcloud import WordCloud

# 设置格式
wc = WordCloud(width=1024, height=768, background_color='white',
               font_path='STKAITI.TTF', max_font_size=400, random_state=50)
# 从频率字典中生成词云
wc.generate_from_frequencies(
    {'Python': 5, 'Hadoop': 10, 'Spark': 20, '大数据': 5, '人工智能': 2, '数据': 3})
wc.to_file('词云.jpg')
plt.imshow(wc)
plt.show()

在这里插入图片描述

generate或generate_from_text 从字符串中生成词云

该方法需要传入一个字符串，每个词之间用' '空格隔开，

import matplotlib.pyplot as plt
from wordcloud import WordCloud

sentence = '路透社本周早些时候报道，寻求收购 TikTok 的字节跳动投资者对其估值高达500亿美元,\
TikTok在上个月被印度政府封禁后，7月28日，日本自民党议员联盟也向政府建议禁用TikTok等中国企业App。'
# 删除特殊符号
sentence = re.sub('[\'!"#$%&\'()*+,-./:;<=>?@，。?★、…【】《》？“”‘\'！[\\]^_`{|}~\s]+', "", sentence)
# jieba中文分词
words = list(jieba.cut(sentence))
# ['路透社', '本周', '早些时候', '报道', '寻求', '收购', 'TikTok', '的', '字节', '跳动', '投资者',
# '对', '其', '估值', '高达', '500', '亿美元', 'TikTok', '在', '上个月', '被', '印度政府', '封禁',
# '后', '7', '月', '28', '日', '日本自民党', '议员', '联盟', '也', '向', '政府', '建议', '禁用',
# 'TikTok', '等', '中国', '企业', 'App']

# 设置格式
wc = WordCloud(width=1024, height=768, background_color='white',
               font_path='STKAITI.TTF', max_font_size=400, random_state=50)
# 用空格隔开每个词
wc.generate_from_text(' '.join(words)) # 或者 wc.generate(' '.join(words))
wc.to_file('词云.jpg')
plt.imshow(wc)
plt.show()

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【WordCloud】生成词云的相关文章

centos下安装chrome

到网页 https www google cn chrome 点击安装下载 rpm安装包安装即可 root 64 localhost 下载 yum localinstall google chrome stable current x8
【双指针】80. 删除排序数组中的重复项 II

题目给定一个排序数组 xff0c 你需要在原地删除重复出现的元素 xff0c 使得每个元素最多出现两次 xff0c 返回移除后数组的新长度不要使用额外的数组空间 xff0c 你必须在原地修改输入数组并在使用 O 1 额外空间的条件下完成
【双指针】27. 移除元素

题目给你一个数组 nums 和一个值 val xff0c 你需要原地移除所有数值等于 val 的元素 xff0c 并返回移除后数组的新长度不要使用额外的数组空间 xff0c 你必须仅使用 O 1 额外空间并原地修改输入数组元素
【栈】155. 最小栈

题目设计一个支持 push xff0c pop xff0c top 操作 xff0c 并能在常数时间内检索到最小元素的栈 push x 将元素 x 推入栈中 pop 删除栈顶的元素 top 获取栈顶元素 getMin 检索栈中的最小元素
【数组】初始化、获取长度

初始化 xff0c 获取长度 span class token keyword public span span class token keyword class span span class token class name main
【Stack】简单使用

入栈 xff1a add获取栈顶元素 xff1a peek出栈 xff1a pop span class token keyword import span java span class token punctuation span ut
【HashMap】基本操作

添加键值对put获取key对应的value get遍历 xff1a keySet span class token keyword import span java span class token punctuation span uti
【单调栈】496. 下一个更大元素 I

题目给定两个没有重复元素的数组 nums1 和 nums2 xff0c 其中nums1 是 nums2 的子集找到 nums1 中每个元素在 nums2 中的下一个比其大的值 nums1 中数字 x 的下一个更大元素是指 x 在 n
【堆】建堆、插入、删除、堆排序

参考堆就是利用数组来实现二叉树 xff0c 可用于构建优先队列堆排序 TopK问题等可分为 xff1a 最大堆 xff1a 父节点的值比其子节点大最小堆 xff1a 父节点的值比其子节点小堆的根节点存放了最小 xff08 或最大 x
【RDD编程】cache持久化使用场景

Spark中RDD采用惰性求值的机制 xff0c 每次遇到action操作都会触发一次从头开始执行的计算 xff0c 在某些场景下这会使得程序性能大幅度降低例如下面例子 xff0c 在rdd13 count 时将触发一次从rdd1开始到r
【Java】自带sort库使用

Arrays sort arr span class token keyword public span span class token keyword class span span class token class name mai
如何使UDEV规则有效

转 victor 64 X301A1 ls etc udev rules d 70 persistent cd rules 70 persistent net rules README 然后 xff1a victor 64 X301A1 s
【堆】剑指 Offer 40. 最小的k个数

输入整数数组 arr xff0c 找出其中最小的 k 个数例如 xff0c 输入4 5 1 6 2 7 3 8这8个数字 xff0c 则最小的4个数字是1 2 3 4 示例 1 xff1a 输入 xff1a arr 61 3 2 1 k
【堆】703. 数据流中的第K大元素

设计一个找到数据流中第K大元素的类 xff08 class xff09 注意是排序后的第K大元素 xff0c 不是第K个不同的元素你的 KthLargest 类需要一个同时接收整数 k 和整数数组nums 的构造器 xff0c 它包含数据
【Queue】简单使用

java中LinkedList实现了Queue接口 xff0c 可以当作队列使用添加元素 xff1a offer或add方法 xff0c add方法在失败的时候会抛出异常不推荐删除元素 xff1a remove和poll方法都是从队列
【树】剑指 Offer 55 - I. 二叉树的深度

题目输入一棵二叉树的根节点 xff0c 求该树的深度从根节点到叶节点依次经过的节点 xff08 含根叶节点 xff09 形成树的一条路径 xff0c 最长路径的长度为树的深度例如 xff1a 给定二叉树 span class tok
【树】剑指 Offer 28. 对称的二叉树

题目请实现一个函数 xff0c 用来判断一棵二叉树是不是对称的如果一棵二叉树和它的镜像一样 xff0c 那么它是对称的例如 xff0c 二叉树 1 2 2 3 4 4 3 是对称的 span class token number 1
【图】1042. 不邻接植花

题目有 N 个花园 xff0c 按从 1 到 N 标记在每个花园中 xff0c 你打算种下四种花之一 paths i 61 x y 描述了花园 x 到花园 y 的双向路径另外 xff0c 没有花园有 3 条以上的路径可以进入或者离开
【LinkedList】基本操作、图的邻接表

基本操作创建 LinkedList span class token generics function span class token punctuation lt span Integer span class token punc
【Python】配置文件configparser

使用configparser模块读取模型参数 xff0c 设置config ini文件内容如下 xff0c train 和 savepath 分别为两个session span class token punctuation span tr

随机推荐

【Python】生成随机字符串

参考 span class token keyword import span random span class token keyword def span span class token function random str sp
【动态规划】64. 最小路径和

题目给定一个包含非负整数的 m x n 网格 xff0c 请找出一条从左上角到右下角的路径 xff0c 使得路径上的数字总和为最小说明 xff1a 每次只能向下或者向右移动一步示例输入 1 3 1 1 5 1 4 2 1 输出 7
树莓派无法安装pyqt5与pandas

问题描述使用pip3 install安装一些包 xff0c 例如pyqt5 pandas无法成功 sudo pip3 install pandas sudo pip3 install pyqt5 无法安装解决方案 xff1a 安装pan
【Java】二维数组初始化

带值初始化 span class token keyword int span a span class token punctuation span span class token punctuation span span class
【图】1162. 地图分析（多源BFS）

题目你现在手里有一份大小为 N x N 的地图 xff08 网格 xff09 grid xff0c 上面的每个区域 xff08 单元格 xff09 都用 0 和 1 标记好了其中 0 代表海洋 xff0c 1 代表陆地 xff0c
【tensorflow】数据增强

使用tf image对图片进行数据增强读入图片 span class token keyword from span PIL span class token keyword import span Image span class to
【HashMap】使用自定义类作为key

需要重写hashCode 和equals 方法才能实现自定义键在HashMap中的查找 span class token keyword class span span class token class name Pos span spa
【图】1267. 统计参与通信的服务器

题目这里有一幅服务器分布图 xff0c 服务器的位置标识在 m n 的整数矩阵网格 grid 中 xff0c 1 表示单元格上有服务器 xff0c 0 表示没有如果两台服务器位于同一行或者同一列 xff0c 我们就认为它们之间可以进行通
【并查集】Java实现

并查集理解并查集的数据结构实现一般是数组 xff0c 通过数组来指示各个元素之间的父子关系 xff0c 通常初始化为 1 xff0c 若最终该位置的值大于0 xff0c 则表示该位置是一个孩子 xff0c 其父亲为节点的值并查集的两个重
【并查集】721. 账户合并

题目给定一个列表 accounts xff0c 每个元素 accounts i 是一个字符串列表 xff0c 其中第一个元素 accounts i 0 是名称 name xff0c 其余元素是 emails 表示该帐户的邮箱地址现在
【并查集】面试题 17.07. 婴儿名字

题目每年 xff0c 政府都会公布一万个最常见的婴儿名字和它们出现的频率 xff0c 也就是同名婴儿的数量有些名字有多种拼法 xff0c 例如 xff0c John 和 Jon 本质上是相同的名字 xff0c 但被当成了两个名字公布出来
【Java】字符串比较compareTo

根据字典序比较两个字符串的大小 xff0c 使用compareTo方法 xff0c 如下 xff0c 如果字符串str1和str2相等则res 61 0 xff0c 若str1字典序小于str2则res lt 0 xff0c 否则res g
【Java】String indexOf substring截取字符串

使用indexOf char c 方法获取字符串中第一次出现字符c的下标 xff0c 例如 span class token keyword public span span class token keyword class span s
树莓派3B+环境搭建

转载 xff1a https blog csdn net zhangjun62 article details 80517176 我的树莓派3b 43 没有买HDMI 屏 xff0c 利用网线与电脑主机相连操纵树莓派如果买回来接上电 xf
【Scala】创建整型数组

var res span class token operator 61 span new ArrayBuffer span class token punctuation span Int span class token punctua
【RDD编程】map和mapPartitions

map和mapPartitions map针对RDD中的每一个元素调用一次函数 xff0c 而mapPartitions针对RDD中每个Partition调用一次函数 xff0c 假设RDD有N个元素 xff0c 有M个分区 xff0c 那
【Spark入门项目】词频统计

项目要求要求统计txt英文文件中每个单词出现的次数 txt文件内随机拷贝英文内容 xff0c 如下 The scientists re analysed a sample collected by NASA astronauts duri
【jieba】中文分词

span class token keyword import span jieba words span class token operator 61 span jieba span class token punctuation sp
【Python】读取中文

fn span class token operator 61 span span class token builtin open span span class token punctuation span path span clas
【WordCloud】生成词云

generate from frequencies xff1a 从频率字典中生成词云该方法传入统计好的词频字典 xff0c 例如 39 Python 39 5 39 Hadoop 39 10 39 Spark 39 20 39 大数据 3

【WordCloud】生成词云

generate_from_frequencies：从频率字典中生成词云

generate或generate_from_text 从字符串中生成词云

【WordCloud】生成词云 的相关文章

随机推荐

热门标签

【WordCloud】生成词云的相关文章