Wordle是优秀的信息可视化吗?如何真正使用Wordle?

2023-11-19

《数据可视化之美》(Beautiful Visualization)

Wordle是优秀的信息可视化吗?

如果你认为Wordle 是严格意义上的信息可视化工具,它在设计的某些方面存在误导或者干扰用户的潜在可能,有必要指出并加以批判。以下是我认为Wordle 存在的不足之处。

单词大小调整太初级

Wordle 在计算其字体大小时,并没有考虑单词的长度,或者它所绘制的文字的字形。其结果是,给定使用次数相同的两个单词,包含的字母越多的单词在屏幕上会占用更多的空间,这可能会给读者带来这样的印象:单词越长,其出现频度越高。

此外,据我所知,在关于单词大小和感知上的相对权重的关系上没有任何研究。更糟糕的是,常见的策略是把单词的权值根据其平方根进行缩放(为了体现单词拥有区域而不仅仅是长度这一事实),这只会使Wordle 显得很无聊。

颜色毫无意义

在你的电脑屏幕的中央提供了最宝贵的几个维度,令人吃惊的是,Wordle 在颜色使用上非常“散漫”。在Wordle 中,颜色是毫无意义的;它仅仅是用来提高单词边界的对比度和增加一些美感。

颜色可以用于对各个维度进行编码,如聚集(意味着这些单词通常是一起使用的)或者统计学意义(如图3-19 中的总统就职演说的单词云)。Wordle 还可以使用颜色在同一空间表示两种或者更多不同的文本。

值得一提的是,Wordle 并没有为色盲的读者做出什么特意安排,虽然人们总是可以通过应用小程序的色彩菜单栏创建一个定制的调色板。

3-19
图3-19 :这个演讲使用了很多“Government ”(政府)这个词,但是在其他演讲中该词用得更多;“pleasing ”(愉快)只被用了几次,但是它在语料库中是一个不寻常的单词;“people”(人民)被用了很多,其频率在该演讲中非同寻常。

字体是使人充满遐想的

Wordle 的很多字体都更倾向于美学和表现力,而不是可读性。这么做的原因一部分是因为Wordle 的Web 站点设计——如果缺乏形式多样的字体,画面将是单调的。最重要的是,Wordle 中的字体必须看起来很优美,这意味着它不一定很适合于正文文本。

对于易读性至关重要的应用,Wordle 提供了Ray Larabie 的Expressway 字体,该字体被美国运输部作为标准字母。

字数计数不够具体

Wordle 对《New Testament 》中的每一卷的页面中出现的“Lord ”(上帝)这个单词的次数进行了求和,但是它没有提供任何关于各个章节的区别的信息。仅仅简单地对单词计数并不能对相似的文本做出有意义的比较。比如有一个博客帖子,突出该帖子和该博客的其他帖子的不同之处,或者说明它和其他博客的在同一主题上的区别,甚至是说明该帖子和新闻报道文章的用语的不同,这些方面的说明可能是最具有启迪性的。

存在很多统计学方法,可以应用于一篇“样本”文章,来基于一些“范文”的正文来抽取“样本”中的特定字符,尤其注意一些单词的使用在统计上是更重要的。除了单词出现频度,还可以对单词权重进行更细致深入地探析,然后应用Wordle 布局算法来展示结果。

在分析每个总统就职演说时,我都探索了这个想法,把每个演说都和当时最接近的5个演讲、10 个最接近的演讲以及所有其他的就职演说进行了比较。这种分析的优点是可以揭示一些不可预见的单词。举个例子,图3-20 是哈里·杜鲁门在1948 年的就职演说的可视化。左侧是该就职演说中使用的单词的Wordle 形式的展现,右侧是他那个时代的其他总统所使用次数更多的单词的展现。该可视化展现说明了杜鲁门的演说强调的是对外政策。

3-20
图3-20 :哈里·杜鲁门在1948 年的总统就职演说:和他同时代的其他总统就职演说相比,杜鲁门的演说当中很明显缺乏那些红色标注的单词。

如何真正使用Wordle?

Wordle 不是为可视化专家、文本分析专家甚至是有经验的计算机用户而设计的。我试着把Wordle 做得尽可能像个工具。

在撰写本章时,人们在Wordle 画廊中已经创造、保存了超过140 万的“单词云”。这些单词云被用于:总结和修饰商务演示和博士论文,插图说明新的文章和电视新闻报道,提炼和抽象受害者个人痛苦的回忆。Wrodle 还发现形形×××的充满热情的教师社区,他们使用Wordle 来展示拼写列表、总结话题以及促使不识字的青年参与到享受文本的乐趣中。

如表3-1 的调查结果表明(Viégas、Wattenberg 和Feinberg,2009 ),使用Wordle 激发了人们的创造力,人们会觉得他们正在做创造性的事情。

表3-1 :人们创造Wordle时的感受  

感受 赞成% 中立% 不赞成%
激发我的创造力 88 9 4
我感到一种情绪反应 66 22 12
从文本中我学到了一些新的知识 63 24 13
它证实了我对文本的理解 57 33 10
它勾起了我的回忆 50 35 15
Wordle 使我感到困惑 5 9 86

因此,通过对可视化效能应用传统的学术评估——“从文本中我学到了一些新的知识”——至少可以认为Wordle 是比较成功的。但是Wordle 真正闪光之处在于其交际作品的创作。使用Wordle 的人们感觉他们似乎创造了一些东西,它成功地表示一些有意义的事物,并准确地反映或增强了源文本。这种意义看起来主要是直观的,因为很多人并没有意识到单词大小和单词频度是相关的(相反地,猜测该大小表示“情感重视”甚至是“单词意义”)。

Wordle 的特性缘于文本的特性。只是简单地把一个单词放到屏幕上,其字体要么对单词本身的涵义进行补充,要么对其进行反衬,可以马上使读者产生共鸣(实际上,在公共画廊上保存了成千上万的单词)。当你把两个或者更多的单词并排展示时,一个有文化的人就会自然而然地去理解该序列化单词。Wordle 对单词的随机组合给人们创造了喜悦、惊喜、某种程度的认可,以及如诗般激发了人们的洞察力。

为传统的信息可视化使用Wordle

Wordle 的信息可视化分析用途当然可以为专业用户所用,更不用说Wordle 所具备的特定的情感和交际特性。为了满足那些使用Wordle 给“加权文本”创建可视化的用户,其权重不一定是基于单词的出现频度,Wordle 的Web 站点提供了“高级”用户界面,用户可以输入包含任意(可选)色彩的加权单词或短语的表格数据。

Wordle 的更高级的使用方式可能是通过“单词云生成器”控制台应用程序,可以通过IBM 的alphaWorks Web 站点进行查看。

ManyEyes 协作式数据可视化网站还把Wordle 作为文本可视化选项,其他的还有创新型的Phrase Net 和Word Tree 可视化(以及更传统的标签云)。

 

 

---------------------------
本文节选自《数据可视化之美》(Beautiful Visualization)第3章“Wordle”,作者Jonathan Feinberg。
更多本书相关链接,请点击:【华章官网】【互动网】【卓越网】【当当网】【京东网】【豆瓣网

转载于:https://blog.51cto.com/hzbook/599260

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Wordle是优秀的信息可视化吗?如何真正使用Wordle? 的相关文章

  • pytorch小问题

    pytorch张量的保存和恢复 tensor本身就是对象 如果想要保存和恢复对应的对象 使用 torch save 和 torch load即可 就像picke的load 和dump一样 t2 torch randn 1024 1024 t
  • Java Spring @Scheduled 定时任务crontab表达式设置

    Java Spring Scheduled 定时任务crontab表达式设置 1 Cron详解 2 例子 参考 1 Cron详解 Cron表达式是一个字符串 字符串以5或6个空格隔开 分为6或7个域 每一个域代表一个含义 Cron有如下两种
  • React(一):React的设计哲学 - 简单之美

    React 一 React的设计哲学 简单之美 React 二 React开发神器Webpack React 三 理解JSX和组件 React 四 虚拟DOM Diff算法解析 React 五 使用Flux搭建React应用程序架构 Rea
  • Java程序员开发软件(工具)清单

    亲 你准备好了吗 001 项目管理 禅道 JIRA 002 办公协同 钉钉 003 工作邮件 Foxmail OutLook 004 项目文档 MS Office Word Excel PowerPoint WPS 005 MD 笔记 Ty
  • openGL之API学习(六十九)水平同步 垂直同步

    垂直和水平是CRT中两个基本的同步信号 水平同步信号决定了CRT画出一条横越屏幕线的时间 垂直同步信号决定了CRT从屏幕顶部画到底部 再返回原始位置的时间 而恰恰是垂直同步代表着CRT显示器的刷新率水平 垂直同步打开 那么在游戏中 或许强劲
  • 用 LangChain 构建基于资料库的问答机器人(二):从资料源中提取文本信息

    大家好 我是学生大使 Jambo 这个系列的目标是做出一个根据资料回答问题的机器人 那么从资料源中提取文本信息就是一件必要的事 但我们的资料源格式是多样的 比如 PDF Word HTML PPT 等等 甚至有的资料源来自于网络 这些格式都
  • Android studio 怎样连接手机运行,Android studio连接手机调试

    今天百度了一下如何在在Android studio如何在真机上运行 比较复杂 看了很多 现在给大家总结一下 1 首先要将手机连接到电脑上 直接在电脑上安装一个应用宝 然后在手机上也安装一个应用宝 通过应用宝将手机连接到电脑上 2 打开手机的
  • Nacos下载安装与配置(windows)

    一 Nacos下载 外网不好下载以下提供了两个版本 官网地址 https nacos io zh cn 蓝奏云地址 nacos server 1 4 1 zip 蓝奏云 1 4 1 版本 windows nacos server 2 0 0
  • 像智能手机一样造车,可能吗?

    造车这件事有多火 从小鹏 理想等昔日 造车新势力 在互联网军团的入局浪潮中 都变成了 前浪 就可见一斑 春节前后 我们见证了一波波互联网企业在汽车领域的布局 百度与吉利组建合资公司 苹果传出与韩国现代合作 阿里与上汽的智己汽车注册不到20天
  • 2023年VSCode插件最新推荐(54款)

    本文介绍前端开发领域常用的一些VSCode插件 插件是VSCode最重要的组成部分之一 本文列出了我自己在以往工作经验中积累的54款插件 个人觉得这些插件是有用或有趣的 根据它们的作用 我粗略的把它们分成了代码管理 文本和图片处理 前端框架
  • 端到端学习在车辆测距中的探索与实践

    yolo车距1 订阅车距专栏获得源码 http t csdn cn sU3U6 随着深度学习技术的快速发展 端到端学习在计算机视觉领域取得了显著的成果 端到端学习是一种直接从输入数据到输出结果的模型训练方法 无需进行复杂的特征工程 在车辆测
  • 【Arduino学习】05.驱动4个数码管

    数码管介绍 如图 本次使用的数码管为共阴极 四个数码管有 12 个引脚 可以分为位选脚和段选脚 段选脚 8个引脚a b c d e f g 位选脚 4 个引脚 D1 D2 D3 D4 哪个数码管显示由片选脚决定 片选脚为高电平 则该数码管点
  • 九宫格人车识别

    一 原理 通过霍夫检测圆的个数来识别小人位置 二 过程 1 二值图像 2 去掉宫格内容 便于分割 3 对二值图填补 减少纹理 4 分割九宫格 依次检测每个宫格中圆个数 5 最终显示小人所在宫格图片 在img6 jpg中 详细程序运行结果 三
  • xshell连接提示Linux服务器发送了一个意外的数据包

    服务器发送了一个意外的数据包received 3 expected 20 打开需要连接的Linux主机 编辑vim etc ssh sshd config 在最后一行添加 KexAlgorithms curve25519 sha256 li
  • Java通过自定义类加载器模拟冰蝎免杀功能

    一 Java类加载器 类加载器属于JVM的一个重要知识点 也是Java安全里命令执行 webshell管理器编写的常用技术 类加载器简介 我们知道java源文件在运行前会被编译为class类文件 存放着编译后JVM虚拟机指令的二进制字节流
  • 字符编码悉知

    1 查看windows系统代码页 代码页是字符集编码的别名 也有人称 内码表 早期 代码页是IBM称呼电脑BIOS本身支持的字符集编码的名称 当时通用的操作系统都是命令行界面系统 这些操作系统直接使用BIOS供应的VGA功能来显示字符 操作
  • BrokenPipeError: [Errno 32] Broken pipe

    运行Pytorch tutorial代码报错 BrokenPipeError Errno 32 Broken pipe 源代码地址 Training a classifier CIFAR10 该问题的产生是由于windows下多线程的问题
  • QMap遍历(修改)

    方法一 STL风格的遍历器 个人较常用 直观易读 方便修改值 QMap
  • 解决 MDK keil 注册中出现 TOOLS.INI TOOLCHAIN NOT INSTALLED 办法

    MDK Keil 兼容 C51 Keil 我们的电脑有32位系统和64位系统 当keil出现这个错误时 可以按以下办法解决 有两种解决办法 第一种 同时安装MDK Keil 和 C51 Keil 有可能解决此问题 安装必须路径相同 第二种
  • leetcode-合并两个有序链表(详解)

    合并两个有序链表 前言 一 题链接 题意 题思路 题思路图解 题代码 总结 前言 路漫漫及修远兮 一 题链接 题意 将两个升序链表合并为一个新的 升序 链表并返回 新链表是通过拼接给定的两个链表的所有节点组成的 输入 l1 1 2 4 l2

随机推荐

  • 【车道线】TwinLiteNet 复现过程全纪录

    码字不易 喜欢的请点赞收藏 论文全文翻译 freespace TwinLiteNet An Efficient and Lightweight Model for Driveable Area and Lane Segmentation 莫
  • 虹软人脸识别 - ArcFace SDK介绍及使用注意事项

    很多朋友在开发人脸识别系统的时候 会遇到各种各样的问题 现在我们以安卓平台使用虹软的免费离线人脸识别SDK开发为例 给大家介绍一下如何开发一个带有图片的人脸检测 视频画面的人脸属性检测 人脸注册识别等功能的人脸识别系统 一 获取SDK 1
  • [rk3588]多种wifi模组兼容

    硬件部分 M 2接口 使用的wifi模组是PCIE接口的RTL8852BE和SDIO接口的AP6256 软件部分 M 2接口介绍 M 2接口是一种用于连接各种扩展设备的接口标准 它最初设计用于连接固态硬盘 SSD 但也广泛用于连接其他设备
  • spark hadoop环境及运行

    hadoop配置 在Ubuntu20 04里安装Hadoop详细步骤 图文 亲测成功 ubuntu20 04安装hadoop 菜鸡的学习之路的博客 CSDN博客 启动hadoop root ubuntu usr local hadoop s
  • 服务器处理发生异常:java.text.ParseException: Unparseable date

    测试上传报文的时候遇见报错 服务器处理发生异常 java text ParseException Unparseable date 2023 03 03 错误报文 实际需要的报文 错误原因 上传时间字段 与Date字段数据位数不匹配 Jav
  • python贝叶斯网络预测模型_高效灵活的概率建模方法基于Python

    前言 在今天给大家介绍一个研究工具 pomegranate 它比其他软件包更加灵活 更快 直观易用 并且可以在多线程中并行完成 The API 主要模型介绍一般混合模型 隐马尔可夫模型 贝叶斯网络 贝叶斯分类器 所有模型使用做多的方法 mo
  • 迪杰斯特拉(Dijkstra)算法求最短路径

    文章目录 一 最短路径 二 基本思想 三 步骤图解 步骤 S中存放的是已经求得的最短路径的终点的集合 v s集合包含其他点 i代表第i条最短路径 及可能路径走法 邻接矩阵表示弧 一 最短路径 从某顶点 源点 出发到另一顶点 目的地 的路径中
  • 【数据挖掘】数据挖掘比赛项目-kaggle泰坦尼克号

    数据挖掘实战项目 kaggle泰坦尼克号生还者预测 ing kaggle泰坦尼克号生还者预测 泰坦尼克号 从灾难中学习机器 kaggle网站连接 链接 https www kaggle com c titanic 一 实战项目描述 1 项目
  • uniapp判断h5运行环境(微信、pc、移动端)

    isOpenMode 平台 设备和操作系统 var system win false mac false xll false ipad false 检测平台 var p navigator platform system win p ind
  • 文件内存映射mmap解决大文件快速读写问题

    转自 http blog csdn net gulaizi article details 6325726 mmap函数主要用途有三个 1 将一个普通文件映射到内存中 通常在需要对文件进行频繁读写时使用 这样用内存读写取代I O读写 以获得
  • 5、Ubuntu20常用操作_进程管理&重定向和管道&常用命令&网络管理&构建web静态服务器nginx

    进程管理 进程的概念 大家比较熟悉 Windows 下的可执行文件 就是那些扩展名为exe的文件 大家知道 只需要鼠标双击这些程序 就可以运行了 程序运行起来后 我们把这个程序正在运行的 实例 称之为 进程 操作系统对每个进程都分配一个数字
  • 小程序添加本地图片

    写背景图片的时候用了本地的图片 报错说是不能直接使用本地图片 只能使用
  • 为什么振荡电路晶体旁要放22pF电容?

    振荡电路用于实时时钟RTC 对于这种振荡电路只能用32 768KHZ 的晶体 晶体被连接在OSC3 与OSC4 之间而且为了获得稳定的频率必须外加两个带外部电阻的电容以构成振荡电路 32 768KHZ的时钟晶振产生的振荡信号经过石英钟内部分
  • (ps2019)Photoshop 2019 最新破解版下载

    Photoshop CC 2019新增功能 下载地址点我 新功能介绍 https helpx adobe com cn photoshop using whats new html 经过改良设计的内容识别填充 借助 Adobe Sensei
  • 设计简单算数表达式语法分析器算法(LR来实现)

    include
  • 高通平台中gpio简单操作和调试

    做底层驱动免不了gpio打交道 所以对其操作和调试进行了一下简单的梳理 一 gpio的调试方法 在Linux下 通过sysfs 获取gpio状态 也可以操作gpio 1 获取gpio状态 cd sys kernel debug cat gp
  • R语言聚类分析

    本文首发于公众号 医学和生信笔记 完美观看体验请至公众号查看本文 文章目录 系统聚类 层次聚类 Hierarchical clustering 快速聚类 划分聚类 partitioning clustering K means聚类 围绕中心
  • kettle开发-Day40-AI分流之case/switch

    前言 前面我们讲到了很多关于数据流的AI方面的介绍 包括自定义组件和算力提升这块的 今天我们来学习一个关于kettle数据分流处理非常重要的组件Switch Case 当我们的数据来源于类似日志 csv文件等半结构化数据时 我们需要在数据流
  • Node.js安装与配置(详细步骤)

    前言 本篇博文记录了Node js安装与环境变量配置的详细步骤 旨在为将来再次配置Node js时提供指导方法 另外 Node js版本请根据自身系统选择 安装位置 全局模块存放位置和环境变量应根据自身实际情况进行更改 Node js安装与
  • Wordle是优秀的信息可视化吗?如何真正使用Wordle?

    数据可视化之美 Beautiful Visualization Wordle是优秀的信息可视化吗 如果你认为Wordle 是严格意义上的信息可视化工具 它在设计的某些方面存在误导或者干扰用户的潜在可能 有必要指出并加以批判 以下是我认为Wo