Tableau Prep 数据处理工具使用入门

2023-11-12

1. 什么是Tableau Prep

2018.04, Tableau 推出全新的数据准备产品——Tableau Prep。主要用户定位于如何帮助人们以快速可靠的方式对数据进行合并、组织和清理，进一步缩短从数据获取见解所需的时间。简而言之，Prep是一款简单易用的数据处理工具（部分ETL工作）。之所以使用Tableau Prep, 是因为我们在使用BI工具进行数据可视化展示时，常常数据不具有适合分析的形制（数据模型），很难应对复杂的数据准备工作。因此，我们需要一种更方便的工具来搭建我们需要的数据模型。

2. 下载Tableau Prep

官方链接地址： https://www.tableau.com/products/prep。目前Prep提供30天的试用，现有的 Tableau Desktop 客户可在 2020 年之前免费使用 Tableau Prep。同时支持WIN及MAC系统。

Desktop的key无法直接激活Prep, 根据官方介绍，需要进入tableau client portal，使用administrator账户登陆，即可以看到已经购买的Desktop key，以及1个Prep的Key. 此Key可以激活与desktop key关联电脑上的prep.

3. 使用Tableau Prep

3.1 打开Prep

如图，Prep保持了与Tableau Desktop一致的蓝色基调UI，默认英语，未支持多语言选择。界面分为3部分，左边第一部分进行数据链接，中间是最近使用过得操作流程及预设的展示操作流程（还是大家熟悉的超市数据），右侧是一些教学资源。

3.2 连接数据源

通过点击左侧connection,可以看到目前Prep支持的数据文件及数据库。

今天我们使用超市数据进行展示，和Desktop类似，只需要使用简单的托拉拽选择需要用到的表

3.3 数据处理

左上方出现的订单即为我们选择的表，点击右侧的加号，进行选择下一步操作。包括：添加步骤（Add step），添加聚合（Add aggregate，添加行列转换（Add pivot）,添加关联（Add join），添加并集（Add union），添加输出（Add output）

3.3.1 添加步骤（Add step）

该步骤目的是进行数据清洗，可以根据自己的需求进行数据筛选，字段切割，字段重名，通过函数新建字段以及删除字段。

3.3.2 添加聚合（Add aggregate）

该步骤可以将数据按照需求进行聚合。例如超市数据中，我只需要看到不同产品在不同城市的销售情况，不考虑客户。我只需要选择城市、产品、销售额，Prep就会根据我们的需求将数据进行聚合。

3.3.3 添加关联（Add join）& 添加并集（Add union）

关联包含了左连接，右连接即全连接，与桌面端基本一致，在这里不多做介绍。

3.3.4 添加输出（Add output）

处理完毕的数据通过此步骤导出，导出的文件可以选择为Hyper(桌面端10.5以上的数据文件类型），TDE（10.5以下数据文件类型）及CSV。用户同样可以将数据上传至Tableau Server，便可以在使用桌面端时应用SERVER中的数据进行可视化操作。

4.总结

如开头所言，Prep是一款简单易用的数据处理工具，它可以完成大部分ETL的工作。操作十分简单方便，目前测试下来处理速度和承载能力也足够支持大部分企业级的工作。并且弥补了Tableau桌面端在数据处理环节上的空白。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tableau Prep 数据处理工具使用入门的相关文章

Pentaho Report Designer 教程（一）初识

软件版本 Pentaho Report Designer 5 0 1 stable 一 Pentaho Report Designer 的安装 Pentaho Report Designer PRD 由Java编写所以在使用之前应该先安装J
python dict无需判断key存在即可追加写入

使用dict setdefault 可设置一个默认值如果key已存在就不会有其他操作借此我们可以不用在追加数据时判断key的存在 my dict 建立一个空字典 my dict setdefault key 设置默认键 print a
R数据处理——按符号分割数据&统计两列数据组合的频数

初始数据格式数据格式如图所示每个Keywords里面都含有多个关键词使用分号间隔开一共有ABCDEF六个group 并且关键词有重复最终想要的数据格式统计所有不重复的关键词在六个group中出现的频次使用R来处理 rm li
时序预测

时序预测 MATLAB实现时间序列回归之似然检验目录时序预测 MATLAB实现时间序列回归之似然检验基本介绍程序设计学习小结参考资料基本介绍使用 CNLM 假设制定的 t 和 F 检验版本可以在创新分布偏离规范的各种情况下提
dataframe显示数据处理进度

显示效果如下 tqdm搭配progress apply使用 from tqdm import tqdm tqdm pandas desc pandas bar df result df score progress apply lambda
时序预测

时序预测 MATLAB实现时间序列回归之评估模型残差及统计分布目录时序预测 MATLAB实现时间序列回归之评估模型残差及统计分布基本介绍程序设计异方差性统计分布学习总结参考资料致谢基本介绍残差分析的基本目的是检查 CL
成语大全数据提取

成语大全数据提取 Python数据处理数据获取提取成语 1 成语数据从网站上搜集和爬取成语数据成语大全的数据主要以二进制存放在txt文件中目前搜集的成语一共有 31341 条其中绝大部分是四字成语也不少五六字的成语总体来
【学习笔记】python实现excel数据处理

概述 Excel固然功能强大也有许多函数实现数据处理功能但是Excel仍需大量人工操作虽然能嵌入VB脚本宏但也容易染上宏病毒 python作为解释性语言在数据处理方面拥有强大的函数库以及第三方库 excel作为主要基础数据源之一
EISeg——应用于语义分割的自动标注软件

1 基本介绍 EISeg Efficient Interactive Segmentation 是以RITM及EdgeFlow算法为基础基于飞桨开发的一个高效智能的交互式分割标注软件涵盖了通用人像遥感医疗等不同方向的高质量交互式分
MATLAB医学DICOM影像读取与预处理

来点有用的 MATLAB医学DICOM影像读取与预处理一 DICOM文件的读取与解析二 MR与CT像素处理三其他 by HPC ZY DICOM 是医学图像和相关信息的国际标准常见类型有MR和CT 而它们在处理上有细微的不同一
Siebel是什么意思

简介 Siebel是电子商务软件的突出供应商其客户关系管理 CRM 企业资源管理 ERM 以及合作关系管理 PRM 应用设计用于实现企业这些方面的自动化以及允许企业在互联网和零售或电话中心网络等其它渠道来执行和调节相关任务 Sieble的
Adaboost

基本原理基本原理就是将多个弱分类器结合形成一个强分类器 Adaboost采用迭代的思想每次迭代只训练一个弱分类器训练好的弱分类器将参与下一次迭代的使用也就是说在第N次迭代中一共就有N个弱分类器其中N 1个是以前训练好的其各
Python3，Pandas这4种高频使用的筛选数据的方法，不得不说，确实挺好。

Pandas数据筛选方法 1 引言 2 4种高频使用数据筛选方法 2 1 布尔索引 2 2 isin 方法 2 3 query 方法 2 4 loc 方法 3 总结 1 引言小屌丝鱼哥 share一下数据筛选的方法呗小鱼 Excel
Power BI RANKX函数之计算列

转载自知乎在实际做报表时有时会遇到需要对某些指标例如销售额等进行排名所以今天跟大家讨论一下可以实现排名的DAX函数 RANKX函数首先看下RANKX函数的参数 RANKX table table
localStorage的过期时间设置的方法？——和派孔明

我们都知道localStorage不主动删除永远不会销毁那么如何设置localStorage的过期时间呢今天我们来一起尝试一下
什么是BI分析系统

BI分析系统是一种用于帮助企业进行数据分析和决策的工具它通过收集整理分析和可视化庞大的数据集帮助企业了解自身的业务状况并提供有关未来预测和战略决策的有价值信息 BI分析系统以其强大的功能和灵活性在企业管理和决策中发挥着重要的作用
使用pandas groupby的一个案例

mongodb中有下面一组数据业务场景就不介绍了看数据应该很好理解 id 606fdd0805f5710008a82223 brand id 1 brand name APPLE series id 11 series name iPh
腾讯云微计算实践：从Serverless说起，谈谈边缘计算的未来

欢迎大家前往云社区获取更多腾讯海量技术实践干货哦作者黄文俊腾讯云高级产品经理曾经历过企业级存储企业级容器平台等产品的架构与开发对容器微服务无服务器 DevOps等都有浓厚兴趣由腾讯云serverless团队发布在
pandas列值根据字典批量替换

更多更及时内容欢迎留意微信公众号小窗幽记机器学习背景 DataFrame数据中一列的值需要根据某个字典批量映射为字典中的value 方法1 pandas中的df replace import pandas as pd import n
dataframe 使用拉格朗日插值填充缺失值

本例中代码使用 jupyter 运行问题场景在处理dataframe时可能会遇到少量数据缺失的情况在连续缺失数据较少的情况可以考虑插值填充本文调用了scipy库的lagrange x y 这个函数参数x y分别是对应各个点的x值

随机推荐

表情识别综述2018-Deep Facial Expression Recognition: A Survey

表情识别综述2018 Deep Facial Expression Recognition A Survey 一该论文从4各方面应用领域表情数据库识别流程和表情识别的算法讲述了基于深度学习的表情识别在近几年的发展情况该论文根据表
shell对比文件夹（文件）创建时间

判断一个文件夹中的所有文件是否是最近5分钟内创建的 bin bash folder path path to folder current time date s five minutes ago current time 300 300秒
Zabbix监控系统与部署Zabbix5.0监控（系列操作完整版）

目录一监控软件的作用二 Zabbix基本介绍 1 Zabbix是什么 2 Zabbix监控原理 3 Zabbix的优点 4 Zabbix的缺点 5 Zabbix监控系统的监控对象三 Zabbix的监控架构 1 server clie
springboot + mybatis手动提交事务

Service public class MyService Autowired DataSourceTransactionManager transactionManager public ResultMap lockStockWhenN
‘NoneType‘ object has no attribute ‘find_all‘问题解决

Python爬虫问题描述原因分析解决方案问题描述 Python爬虫学习过程中遇到的AttributeError NoneType object has no attribute find all 问题解决 Traceback mos
Shell--基础--09--printf命令

Shell 基础 09 printf命令 1 介绍用于字符串的输出格式如下 printf format string arguments format string 为格式控制字符串 arguments 为参数列表 1 1 format
cubemx串口的发送与接收_USART串口通信，中断方式，一分钟从菜鸟到大师(完整版)...

嵌入式系统中应用最广泛的一种通讯设备只要三根线 TX RX GND 合适低速长距离通讯发送和接收的控制流程如下 1 初始化串口包括使能串口时钟使能发送和接收定义引脚波特率数据位长度奇偶校验方式停止位位数使能串口模块接收中
前端优化页面加载速度的方法（持续更新）

提速方法方向延迟脚本加载使用 async 属性在这种方法中脚本将在下载完成后立即执行而不会阻塞其他页面资源的加载和渲染这适用于那些不依赖于其他脚本和页面内容的脚本例如分析脚本等示例如下 html 注意由于脚本是异步加载的
东方通中间件 - TongWeb 初级

一什么是 TongWeb TongWeb是一个符合J2EE规范的应用服务器产品经过多年市场的应用和考验已经广泛应用在全国各行业的企业级应用系统中简单来说就是东方通中间件东方通 SZ300379 公司开发的类似于IBM公司的 We
小学生学Arduino---------点阵（二）动态图片以及文字

今天进阶了利用人眼视觉暂留原理制作动态的图片变换 1 熟练掌握图片显示器的使用 2 创作多种动态图片文字的显示 3 明确动态图片文字显示过程 4 掌握图片显示器中清空指令的使用 5 搭建动态图片文字的显示电路 6 编写动态图片文字的
QGIS获取OSM地图矢量数据

目录一 QGIS加载OSM底图图层二 quickosm插件导入openstreetmap数据三数据导出四 Overpass query查询用法五写在最后一 QGIS加载OSM底图图层 1 安装QuickMapServices
Android studio生成jks文件/Warning: JKS 密钥库使用专用格式。建议使用 “keytool -importkeystore -srckeystore

这里写自定义目录标题 Android studio生成jks文件开始 Android studio生成jks文件 Key was created with errors Warning JKS 密钥库使用专用格式建议使用 keytool
使用dcmtk获取dicom影像的像素值

include widget h include ui widget h include dcmtk config osconfig h make sure OS specific configuration is included fir
服务器iscsi如何修复,服务器重启后，iSCSI目标卡住了重新连接

编辑 Ok so event 113 is KB972107 which is a fairly generic class of problems but the network stack is not fully prepared c
【Docker 1(1)，献给真心想学Java的打工人

2 docker原理 3 docker为何比VM快 Docker有着比虚拟机更少的抽象层 docker利用的是宿主机的内核 VM需要的是Guest OS 四 Docker镜像常用命令 1 基本命令 docker version docker
华为OD机试真题-最多等和不相交连续子序列【2023.Q1】

题目描述给定一个数组我们称其中连续的元素为连续子序列称这些元素的和为连续子序列的和数组中可能存在几组连续子序列组内的连续子序列互不相交且有相同的和求一组连续子序列组内子序列的数目最多输出这个数目输入描述第一行输入为数组长
html5渐变色毛玻璃,基于CSS3实现的毛玻璃渐变效果

毛玻璃说白了就是磨砂玻璃隔着表面粗糙的磨砂玻璃观赏窗外的风景总会带着点朦胧美给人以若隐若现的感觉远近之间的层次感也因此而被体现出来这种效果不仅美观而且可以通过清晰和模糊的对比来突出重点内容因此被广泛应用于web设计领域本教程
ajax arcengine,ArcGIS客户端开发学习笔记（一）—AJAX机制

摘要 AJAX即 Asynchronous JavaScript and XML 异步JavaScript和XML 现在的GIS客户端编程都是基于Ajax技术的我觉得Ajax最大的特点在于它提供了更好的用户体验以往的Web开发当用户填
区块链技术5--BTC网络

1BTC网络的工作过程用户将交易发布到BTC网络上节点收到交易后打包到区块然后将区块发布到BTC网络上 2BTC网络的工作原理比特币工作于网络应用层其底层网络层是一个P2P Overlay network P2P覆盖网络比特
Tableau Prep 数据处理工具使用入门

1 什么是Tableau Prep 2018 04 Tableau 推出全新的数据准备产品 Tableau Prep 主要用户定位于如何帮助人们以快速可靠的方式对数据进行合并组织和清理进一步缩短从数据获取见解所需的时间简而言之 Pre

Tableau Prep 数据处理工具使用入门

Tableau Prep 数据处理工具使用入门 的相关文章

随机推荐

热门标签

Tableau Prep 数据处理工具使用入门的相关文章