python生成词云--完整代码示例

2023-10-27

工作之余,写个python生成词云来玩玩~~~

运行环境:pycharm,需要引入wordcloud包,中文分词需要用到jieba

随便找了一篇介绍“故宫的文章”,以该文章为例生成词云。

from wordcloud import WordCloud
import matplotlib.pyplot as plt  #绘制图像的模块
import jieba                    #jieba分词

path_txt = 'all.txt'
f = open(path_txt,'r',encoding='UTF-8').read()

# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))

wordcloud = WordCloud(
   #设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
   font_path="C:/Windows/Fonts/simfang.ttf",
   #设置了背景,宽高
   background_color="white",width=1000,height=880).generate(cut_text)

plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

运行结果图如下:

2、可以给给词云加上图片背景 

from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
import  jieba
def GetWordCloud():
   path_txt = 'all.txt'
   path_img = "timg.jpg"
   f = open(path_txt, 'r', encoding='UTF-8').read()
   background_image = np.array(Image.open(path_img))
   # 结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云,感兴趣的朋友可以去查一下,有多种分词模式
   #Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
   cut_text = " ".join(jieba.cut(f))

   wordcloud = WordCloud(
       # 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
       font_path="C:/Windows/Fonts/simfang.ttf",
       background_color="white",
       # mask参数=图片背景,必须要写上,另外有mask参数再设定宽高是无效的
       mask=background_image).generate(cut_text)
   # 生成颜色值
   image_colors = ImageColorGenerator(background_image)
   # 下面代码表示显示图片
   plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")
   plt.axis("off")
   plt.show()

if __name__ == '__main__':
   GetWordCloud()

运行结果图:

选的背景图片如下:

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python生成词云--完整代码示例 的相关文章

  • 【Shell编程】Shell中Bash变量-数值运算、运算符变量、测试和内容替换

    系列文章 Shell编程 Shell基本概述与脚本执行方式 Shell编程 Shell中Bash基本功能 Shell编程 Shell中Bash变量 用户自定义变量 Shell编程 Shell中Bash变量 位置参数变量 Shell编程 Sh
  • 【Leetcode】反转链表 合并链表 相交链表 链表的回文结构

    目录 一 Leetcode206 反转链表 1 链接 2 题目再现 3 解法A 三指针法 二 Leetcode21 合并两个有序链表 1 链接 2 题目再现 3 三指针尾插法 三 Leetcode160 相交链表 1 链接 2 题目再现 3
  • 2240. 买钢笔和铅笔的方案数

    文章目录 Tag 题目来源 题目解读 解题思路 复杂度分析 写在最后 Tag 枚举 数学 题目来源 2240 买钢笔和铅笔的方案数 题目解读 现在你有一笔钱 total 用来购买钢笔和铅笔 它们的价格分别为 cost1 和 cost2 试问
  • cocos creator修改EditorBox,去掉EditorBox的输入历史记录显示,cocos creator屏蔽输入框的历史记录显示

    cocos creator 3 3 2 修改EditorBox的历史记录就需要修改引擎源码 这里找到安装下的引擎源码C CocosDashboard 1 0 11 resources editors Creator 3 3 2 resour
  • ElasticSearch 总结

    ElasticSearch 将需要存储的数据分为 结构化数据 非结构化数据 半结构化数据 结构化数据 一般为二维的表结构 比如一张表包含了用户的姓名性别年龄等信息 一般保存到关系型数据库中 如 MySQL 非结构化数据 是无法用二维表结构表
  • Spring中配置和读取多个Properties文件

    一个系统中通常会存在如下一些以Properties形式存在的配置文件 1 数据库配置文件demo db properties Properties代码 database url jdbc mysql localhost smaple dat
  • 蓝桥杯-决赛A组第九届java

    目录 第1题 三角形面积 第2题 阅兵方阵 第3题 找假币 第4题 版本分支 第5题 自描述序列 第6题 采油 第1题 三角形面积 代码来自CSDN 作者 萤火虫的微亮 原文 https blog csdn net weixin 42318
  • 【4399运维笔试题】

    rsync传输过程中有大文件 默认会做数据校验 所以每次都耗费很长时间 可以使用 W取消校验 1 4 mysqldump uroot pmima B 4699sy gt backup date F 4399sy sql 2 30 0 tar
  • CloudCompare——计算点云曲率

    目录 1 找到曲率计算功能 2 设置计算参数 3 可视化曲率计算结果 4 保存计算结果 5 完整操作流程 6 相关链接 1 找到曲率计算功能 2 设置计算参数 只有一个参数 位置处用于查找最近邻点的球邻域半径 3 可视化曲率计算结果 4 保
  • 保卫家园(小白版)

    保卫家园 牛客 题目链接 https ac nowcoder com acm problem 205068 题目 题目描述 为了抵御深渊的蔓延 被深渊毁掉家园的人们组建法兰不死队来镇压深渊 已知法兰不死队的最大编制为k 即队伍最多能有k人
  • (详解)用C语言实现一个能够连续展开的扫雷。

    功能介绍 我们实现一个扫雷 那么必须具有其基本的功能 如下图 那么相比较一般的用C实现的扫雷 我们需要添加如下的三个功能 防止第一次被炸死 标记雷 连续展开 代码实现以及解释 一 主函数的实现以及扫雷的构思框架 test c int mai
  • 自举电容的工作原理-3句话总结

    1 一道面试题 照例 先抛出来一道面试题 Buck电路的SW引脚通常会放置一颗小电容 这颗电容有什么用 这个问题问得比较细 非常考验被面试者的硬件基本功 2 似懂非懂的答案 有小伙伴可能不太清楚这颗电容的作用 回答不上来 也有小伙伴脱口而出
  • 1 shell备份数据库MYSQL案例

    SHELL编程实战MYSQL备份脚本 编程思路 1 备份MYSQL数据库 备份的工具的选择 数据量小于100G使用全备 基于mysqldump工具备份 备份会锁表 数据量大于100G使用增量备份 基于xtrabackup工具备份 Innod
  • STM32CubeMX新建工程并点亮一个LED

    可提前看 STM32CubeMX环境安装 保姆级 目录 进入STM32CubeMX界面 双击软件 可能会出现的弹窗 更改固件路径 新建工程 进入配置环境 以一个点灯程序为例 GPIO配置 输出电平设置 输出模式 上下拉 输出速度 User
  • 方差

    什么是随机变量的方差 方差反映随机变量取值的什么性质 方差是一个常用来体现随机变量的取值分散程度的量 设 X X X是一个随机变量 若 E X
  • (c语言)输出Programming is fun!

    题目要求 输入 无 输出 Programming is fun 具体代码如下 include
  • 打印从1到最大的n位数

    链接 打印从1到最大的n位数 牛客题霸 牛客网 nowcoder com 描述 输入数字 n 按顺序打印出从 1 到最大的 n 位十进制数 比如输入 3 则打印出 1 2 3 一直到最大的 3 位数 999 1 用返回一个整数列表来代替打印
  • Hands-On Hyperledger Fabric——Fabric的证书(账号)体系

    文章目录 Fabric证书是什么 Fabric证书服务器 Fabric ca fabric ca server的初始化 fabric ca server 配置文件 fabric ca client 使用 将Fabric ca server绑
  • GPT分区规划与各分区作用解析

    1 GPT分区规划 安装用EFI引导的Windows 10前 手动为硬盘分区 推荐方案如下 序号 分区名 起始柱面 磁头 扇区 容量 MBR保留扇区 GPT分区表 1MB 0 ESP分区 0 32 33 96MB 空白 预留给扩展ESP时使

随机推荐

  • 【H5】 svg画贝塞尔曲线方法

    H5 svg画贝塞尔曲线方法 d属性M 起始坐标 L 结束坐标 H 水平线 V 垂直线 A 圆弧 Z 闭合路劲 C S Q T贝塞尔曲线大写为绝对坐标 具体的坐标位置 小写为相对坐标 相对起始坐标点的具体长度 A命令x 径y半径角度弧长 0
  • 关于虚拟机.vmdk与.ovf 磁盘装载问题

    与 vmdk磁盘装载相关的两种方式 0 前言 1 只有 vmdk文件 2 带有 ovf vmdk文件 0 前言 提一嘴 现在用的比较多的虚拟机创建或者拷贝方式有两种 第一种是iso光盘映像装载 第二种是OVF导入 分别为 ISO的装载方式最
  • build JAX from source code

    Building from source JAX documentation
  • visual studio:不能加载.vdproj

    总结 下载后关闭所有vs项目 重新打开目标工程 需要完成次扩展的后续安装任务 参考 https www cnblogs com hofmann p 11183457 htm
  • 122FPS,51.9mAP 超轻量关键点检测算法PP-TinyPose来啦!

    在人机交互场景中 机器可以识别人的手势 肢体动作 表情 你可知背后的核心技术是什么吗 没错 就是关键点检测技术 它能帮你实现精准的人机交互任务 如手势控制 智能健身 体感游戏等 还可以识别交通违规 打架斗殴 违规操作等异常行为 话不多说 我
  • DVWA——XSS(Dom low&medium)

    此文章只用于学习 请勿用作其他违法犯罪行为 以下部分文字内容以图片形式展示 因为JS代码打不上去 目录 前言 XSS攻击流程 XSS的危害 XSS的漏洞类型 JS基本语句 XSS Dom Low XSS Dom Medium 前言 XSS被
  • Ubantu扩展SWAP区,使用gparted,以及死机非热启动解决方法

    Ubantu扩展SWAP区 使用gparted 以及死机非热启动解决方法 Swap分区 强制重启 扩充SWAP Swap分区 Swap分区是用来扩展内存的 即使用一部分硬盘空间作为交换 个人认为电脑内存大于16G即不需要分配Swap空间 我
  • Python字符串替换的3种方法

    Python字符串替换笔记主要展示了如何在Python中替换字符串 Python中有以下几种替换字符串的方法 本文主要介绍前三种 replace方法 常用 translate方法 re sub方法 字符串切片 根据Python字符串切片方法
  • springboot + redis多数据源 + jedis集群模式

    最近有个项目需要redis支持多个集群 网上搜了下 发现有个开源的项目spring boot starter dynamic redis 代码写的挺好 可惜只有单机版的 于是fork了他的代码改了下 支持jedis集群模式 新代码昨天已提交
  • 如何用人工智能预测股票(完整项目)

    本文由 沈庆阳 所有 转载请与作者取得联系 前言 十分钟实现人工智能股价预测 是一个深度学习的练习项目 其通过机器学习算法 根据过去几年与某只股票相关的K线走势 公司相关报道的情感分析作为数据集 通过训练来得到可以预测股价的机器学习模型 并
  • VS2008, MFC 文件的操作4 - CFile类, CFileDialog类 方式 文本方式打开

    接上一节笔记 VS2008 MFC 文件的操作3 Win32 API 方式 文本方式打开 1 代码 及 点击 子菜单项 WriteFile 时候的可选文件 void Cvs2008 SX jiaocheng12View OnFileWrit
  • 【vscode代码片段增加和删除】

    目录 一 概述 二 详解 三 实例 一 概述 项目开发中 存在很多重复代码 可将其抽取出来定义成自己的代码片段 提高编码效率 实现快捷开发 二 详解 详解1 选择并打开代码片段文件 详解2 删除代码片段文件 代码片段文件创建后会一直保存在本
  • Java7对资源释放操作的简化

    学会使用finally释放资源 public class TryCatchResourceDemo public static void main String args try 这里面只能放置资源对象 用完会自动关闭 自动调用资源对象的c
  • 童年回忆——超级玛丽(内含源码inscode一键运行)

    前言 作者主页 雪碧有白泡泡 个人网站 雪碧的个人网站 推荐专栏 java一站式服务 React从入门到精通 前端炫酷代码分享 从0到英雄 vue成神之路 uniapp 从构建到提升 从0到英雄 vue成神之路 解决算法 一个专栏就够了 架
  • RuoYi-Cloud版本限制一个账户只能在一个地方登陆

    RuoYi Cloud版本限制一个账户只能在一个地方登陆 一 前言 二 参考 三 代码实现 三 一 在ruoyi auth模块下的bootstrap yml文件下新增一个配置soloLogin用于限制多终端同时登录 三 二 我是在Cache
  • GUI编程(二)

    Swing Swing是GUI 图形用户界面 开发工具包 早期的AWT 抽象窗口工具包 组件开发的图形用户界面 要依赖本地系统 当把AWT组件开发的应用程序移植到其他平台的系统上运行时 不能保证其外观风格 因此AWT是依赖于本地系统平台的
  • 简单上手Raspberry Pi Pico(macOS+MicroPython)

    昨天写了Ubuntu安装Thonny并连接Pico进行开发的文章 https blog csdn net MacwinWin article details 113097180 今天就来说说在macOS上如何安装Thonny并连接Pico
  • Kubernetes 自动化诊断工具:k8sgpt-operator

    背景 在 Kubernetes 上 从部署 Deployment 到正常提供服务 整个流程可能会出现各种各样问题 有兴趣的可以浏览 Kubernetes Deployment 的故障排查可视化指南 2021 中文版 从可视化指南也可能看出这
  • 图的构建和遍历

    图是一种包括节点和边的数据结构 本文对图的构建 图的遍历给出详细的代码 其中 图的表示方法有 邻接矩阵 邻接表 图的遍历方法有 深度优先搜索 DFS 广度优先搜索 BFS 1 图的表示 1 1 邻接矩阵 include
  • python生成词云--完整代码示例

    工作之余 写个python生成词云来玩玩 运行环境 pycharm 需要引入wordcloud包 中文分词需要用到jieba 随便找了一篇介绍 故宫的文章 以该文章为例生成词云 from wordcloud import WordCloud