如何进行探索式数据分析?

2023-05-16

【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822701 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。

正文开始

很多同学私信问我,关于企业日常的营运数据分析问题,应该怎么去思考、探索、解读?有没有常规数据分析的万能公式?

这,还真可以有!所以今天的内容就决定和大家总结一下,探寻一下日常工作中,怎么分析我们遇到的各种数据分析的疑难杂症。比如,大家日常可能都遇到过如下的问题:

1、今年3月华东区销售额下降了,为什么?

2、上个月北京的业绩增长那么高,为什么?

3、某品牌今年的的客单价下降了,为什么?

4、电商某个渠道的流量质量在下降,有什么问题吗?

5、会员的复购率参差不齐,如何优化?

…………

以上这些都是我们在日常工作中,经常遇到的一些问题,很多人会这些回答:天气不好、股市不好、没人进店、费用不够、营销不精准、商品不给力、客户不配合等等。

以上这些,是一些常见的即兴的借口、托辞,回答的人没有过脑子,提问的人也没有细究,这是目前很多企业各种例会上的现状。但实际上真实原因是这样吗?我们能否从数据中找到以上问题的答案呢?

其实解读企业营运数据问题,都可以通过探索式数据分析,来寻找出答案。

企业营运数据解读的方法,体思路如下 :

1、第一步,找出需要分析数据中的所有的时间、对象和指标。

2、通过对比、细分、溯源贯穿在分析的时间、对象、指标中,去找问题的原因。

其中最核心的,就是探索式数据分析的精髓:


|| 第一步 找出时间、对象和指标 ||

这个步骤略麻烦,但非常值得做,并且最好是画出思维导图帮助缕清思路。

01 时间

常用的时间维度:年、季、月、周、日、时

短期分析的时间维度:滚动7天、滚动14天、滚动28天……

中期分析的时间维度:滚动30天、滚动60天、滚动90天……

长期分析的时间维度:本月累计、本季累计、本年累计……

02 对象

产品:品牌、品类、规格、包装

渠道:批发、KA(大客户)、购物中心、便利店、百货……

价格:平均价格、价格段、价格点、价格区……

区域组织:全国、大区、省份、 城市……

03 指标

完成率:销售完成率、回款完成率、利润完成率……

效率指标:客单价、连带率……

增长率:同比、环比

会员指标:复购率、流失会员数、新增会员数、激活率......

以上这些都是常见的时间、对象、指标,在不同的行业中会有不同,甚至数量更多,具体要根据行业特点去理解。需要注意,数据源中直接可以找到的时间对象指标外,这属于显性的时间对象指标,同时还有很多隐性的时间对象指标,也需要一并找出来。

比如下面一组数据,显性的时间维度是日,不过既然有“日”,通过技术手段很方便的组合成月、季、年等维度,后者就是隐性的时间维度。

这组数据中显性的指标有零售价、成交价、成交数量、成交金额。隐性指标有折扣率(成交价/零售价)、销售占比、排名......

探索式数据分析的前提就是要把数据源中的所有显性、隐性的时间、对象、指标都找出来供下一步使用。

|| 第二步 对比、细分、溯源 ||

如果第一步是动脑的话,这一步就是动手了。并且这步一定是在第一步的基础上进行的,不可以偷懒、投机取巧。

01 对比

我们经常说“没有对比就没有伤害”,数据分析也一样,没有对比就不能发现差异。可以对比不同的时间、对象、指标,以便从中发现问题。

如果对比时间,一般我们就会把对象、指标固定,即对比【不同】时间的【相同】对象、【相同】指标。例如开篇提出的问题中,要分析3月华东区销售额下降的原因,那我们就可以先来对比不同的时间,华东区(【相同】对象),销售额(【相同】指标),在不同的时间下:最近3个月,同比去年的3月,销售额的变化是怎么样的。

同样地,如果要对比【对象】,就把时间、指标固定;如果要对比【指标】,就把时间、对象固定。通过这样的对比我们就能发现差异了。

02 细分

所谓细分,其实就是上面我们举例的【时间】、【对象】、【指标】的细分,可以方便我们由大到小逐层钻取,以便方面我们接下来的溯源。

比如我们通过不同区域的客单价对比发现华东区的客单价是最低的(通过对比发现事实或问题),再看看华东区客单价的环比和同比数据,可以发现华东区这个客单价属于异常值(只有最近比较低)或者正常值(就是一直都低)。

此时我们就可以说华东区的客单价有问题,具体什么问题还需要进行溯源。

03 溯源

所谓溯源,是要找到源头。如果分析的粒度不够,出来的结果就不够深入,只停留在基本的层面。所以你们现在应该明白了为什么要找到所有的时间、对象、指标了吧?

例如华东区客单价下滑,你通过简单地细分,发现主要是浙江客单价在下降导致。但到底是浙江哪个些城市?哪些店铺?从什么时间开始下降的?这些都可以通过溯源找到原因。

所以如果是希望真正地找到源头,可以尽量在分析时细分到最小的单位。例如商品分析时,细分到SKU就是最小单位。

|| 交叉组合分析 ||

所谓探索式的数据分析,就是将所有时间、对象、指标进行组合,探索每个组合中是否有问题,直到最后发现事实或结论为止。简单来说就是有没有问题,探索一下试试。

关于交叉组合分析:就是不同的时间、不同的对象、不同的指标之间可以两两组合,三三组合,nn组合进行分析探索。

例如,我们固定住时间与指标(假定是上半年和成交率),进行【对象】的探索式分析时,可以是单个对象,也可以是不同的二级对象之间比较,甚至三个对象。

如渠道对象中,批发渠道和零售渠道对比。这条分析路径就是:今年上半年(时间)批发渠道(对象)和零售渠道(对象)的成交率(指标)的对比分析。

品类对象中(假设是服装企业)羽绒和棉衣对比。这条分析路径就是:今年上半年(时间)羽绒服(对象)和棉衣(对象)的成交率(指标)的对比分析。

在区域组织中,华东区和华南区对比。这条分析路径就是:今年上半年(时间)华东区(对象)和华南区(对象)的成交率(指标)的对比分析。

上面三条路径属于1个时间、1个对象维度的两个细分、1个指标的,这样的路径可以组合出很多很多来,这就是探索式的数据分析。

除以上1个对象的对比外,我们还可以2个对象、3个对象......n个对象进行交叉组合分析。

不同产品在不同渠道的成交率分析。这条分析路径就是:今年上半年(时间)羽绒服(对象1)在百货商场(对象2)的成交率(指标)的对比分析。

不同产品的不同价位段的成交率分析。这条分析路径就是:今年上半年(时间)羽绒服(对象1)在低价位段(对象2)的成交率(指标)的对比分析。

不同品牌的不同品类的销售额分析。这条分析路径就是:今年上半年(时间)品牌A(对象1)的羽绒服(对象2)的成交率(指标)的对比分析。

上面三条路径属于1个时间、2个对象维度的两个细分、1个指标的,这样的路径同样可以组合出很多很多来,这就是进一步的探索式数据分析。

我们还可以1-3-1的组合路径,比如今年上半年(时间)品牌A(对象1)的羽绒服(对象2)在超市渠道(对象3)的成交率(指标)的对比分析。甚至1-4-1,1-3-2......

这样的组合交叉类型就相当多了,每一种组合、交叉都会形成一条分析的路径,可以让你深入进去分析。要基于你具体分析的问题,可以不断地探索分析。

对象的交叉组合分析

|| 实操工具 ||

基于Exce目前l主要有2种方法可以实现探索式的分析:

1、控件+图表

2、数据透视表

控件+图表属于比较高阶的做法,一般人可能学起来有点难度;如果平常大家解读营运数据时,我建议使用数据透视表,这是Excel中一个非常有用的功能,而且入门简单,所以推荐大家学习使用。

控件+时间-对象-指标

透视表的方法相对简单,比较容易上手。探索的过程其实就是不同时间、对象、指标在透视表中的拖拽过程。

透视表中的时间-对象-指标

需要提醒大家,探索式的数据分析不能瞎探索,一定要有顺序,比如时间从日-月-季-年的顺序,组织从全国-大区-省份-城市-店铺的顺序,由上到下或由下到上都可以。

今天为大家介绍的营运数据解读思路,就是要进行探索式数据分析,大家可以在日常的工作中多点去练习,从不断的实践中吸收知识。多探索就会形成自己分析数据的路径,长期训练就可以做到有章可循、有迹可挖。

不要怕麻烦,数据分析就是寻宝,你一定可以做一个挖宝的分析师!

发现数据异常的分析逻辑

数据分析报告,就该这么写

数据分析真的能驱动用户快速增长么?

数据分析的基本方法论

一份完整的数据分析师成长书单

数据分析师的未来

超级菜鸟如何入门数据分析?

数据分析的套路:经典的6大类分析方法

如何才能成为顶级的数据分析师?

数据分析的道与术

 数据分析人的职场天花板

一次客户细分的实践

经验,套路还是逻辑?从我的一次数据分析经历中能得到什么?

为什么我提交的数据分析报告总是被领导K?

大数据也是个江湖:关于腾讯大数据“购买iPhone人群普遍无房无车学历低”的一地鸡毛

浙江移动发布手机终端大数据分析报告

为什么客户画像这么难?

为什么有些人用3年的时间获得了 你12年的数据分析经验

数据分析师的自我修养

经营分析师如何进一步提升自己的境界

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何进行探索式数据分析? 的相关文章

  • PHP 图片去除水印 去除logo

    使用插件 ffmpeg 点这里 不使用插件 也可以 lt php function CLEAR ICO filename savename Clear W Clear H Clear X Clear Y filename 61 读取图片名
  • Apache Options指令详解

    Options指令是Apache配置文件中一个比较常见也比较重要的指令 xff0c Options指令可以在Apache服务器核心配置 server config 虚拟主机 配置 virtual host 特定目录配置 directory
  • 基于VC开发epoll/linux 程序指南

    1 概述 3 2 背景 3 3 总体思路 3 4 功能特点 4 5 开发工具和操作系统要求 4 5 1 Windows VC 4 5 2 linux g 43 43 4 6 开发人员要求 5 7 Linux针对epoll移植 5 8 VC工
  • Qt Creator闪退解决办法

    Qt Creator闪退解决办法 Qt 今天突然出现所有插件无法打开的问题 xff0c 找了很久的资料也没解决 只能重装QtCreator 结果一点开QtCreator过不了一分钟 xff0c 就闪退 看到windows记录的问题原因是Qt
  • QScrollArea qss样式设置失效问题

    QScrollArea通过样式改变背景色 遇到设置QScrollArea qss无法生效问题 xff0c 网上没找到合适解决办法 xff0c 查看QScrollArea qt4源码后发现 xff0c 增加如下代码之后 xff0c qss正常
  • Android下打印调试堆栈方法

    打印堆栈是调试的常用方法 xff0c 一般在系统异常时 xff0c 我们可以将异常情况下的堆栈打印出来 xff0c 这样十分方便错误查找 实际上还有另外一个非常有用的功能 xff1a 分析代码的行为 android代码太过庞大复杂了 xff
  • 家里的垃圾移动光猫和tp路由器设置

    第一步 xff1a 将TP初始化 第二步 xff1a 将网线一端插在tpwan口 xff0c 就是与众不同的 第三步 xff1a 将TP的LAN口IP改为192 168 2 1 第四步 xff1a 将TP的WAN口设置为 xff1a 这里先
  • 蓝桥杯单片机闪烁灯控制逻辑分析

    以前的闪烁灯上来就是一片代码 xff0c 总感觉不是很靠谱 xff0c 现在决定写一个比较细致的逻辑分析 首先 xff0c 我们先来贴上开发板的电路图 我们首先先看一下上面的流水灯电路图 xff0c 74HC573锁存器进行流水灯的控制 x
  • idea取消vim模式

    在安装idea时选择了vim编辑模式 xff0c 但是用习惯了eclipse xff0c 总是要拷贝粘贴 xff0c 在idea中一直按ctrl 43 c和ctrl 43 v不起总用 于是想把vim模式关闭掉 方法 xff1a 菜单栏 to
  • atcoder beginner contest 142 Disjoint Set of Common Divisors(质因数分解)

    题目大意 xff1a 找出A B中的所有互质的因数 解题思路 xff1a 首先 xff0c 我们必须找出因数 我们知道对gcd a b 进行因数分解就能得到a xff0c b的所有因数 但是这里需要互质的因数 xff0c 所以我们这里需要对
  • spring管理事务控制的问题

    在使用ssm框架开发项目时 xff0c 事务控制交由spring来管理 xff0c 然而在查看日志时发现一个问题 xff1a org mybatis spring SqlSessionUtils closeSqlSession SqlSes
  • 关于 Debian 系统

    Debian是什么 xff1f Debian 计划是一个致力于创建一个自由操作系统的合作组织 我们所创建的这个操作系统名为Debian 操作系统是使计算机运行的基本程序和工具的集合 xff0c 其中最主要的部分称为内核 xff08 kern
  • btrfs的子卷与快照功能--Linux下备份系统

    关于Btrfs 什么是Btrfs 以及它的性能 可以在许多地方查阅得到 这里要提到的是 Btrfs文件系统本身就是由子卷 Subvolumes 构成的 它的top level是由B tree结构的含有目录 文件和子卷等东西构成的子卷 而在t
  • c# 通过dotPeek调试.net源码

    1 安装dotPeek 2 设置dotPeek xff0c 开启pdb服务 3 设置VS xff0c 添加服务来源 取消仅我的代码 4 测试代码 xff0c 在Console WriteLine 打断点 xff0c 并按F11进入 注意 x
  • 超棒的离线文档阅读器:Zeal

    前言 xff1a 大家写代码的时候总会有些方法或者属性不太清楚 xff0c 这时候我们就会打开浏览器 xff0c 然后找官方api或者直接搜索引擎找对应问题 xff0c 无疑花费了大量的时间 所以 xff0c 你需要一个桌面应用Zeal x
  • UITabBarController标签控制器相关设置

    1 根据下标索引以及控制器索引显示需要显示的控制器 self selectedIndex 61 sender tag 100 self selectedViewController 61 VC 2 设置标签控制器下面的文字 这里是设置系统自
  • Node App: Note命令行应用程序

    此程序需安装npm 第三方库yargs 解析命令行参数 xff0c chalk 输出特定样式的文本 安装版本如下 xff1a chalk 4 1 1 yargs 17 0 1 Note 应用程序支持 4个命令 xff1a add 添加一个n
  • 怎么样用批处理来创建一个txt文件

    怎么样用批处理来创建一个txt文件 cd gt test txt cd 表示切换到当前目录 xff0c 这个命令没有任何作用 gt 是重定向符 xff0c 将当前输出重定向到文件 这个命令创建一个名为test txt的空文件
  • STM32F103寄存器方式点亮LED流水灯

    一 设计思路 本实验使用GPIOB GPIOC GPIOD这3个端口控制LED灯 GPIO 是通用输入输出端口的简称 xff0c 简单来说就是 STM32 可控制的引脚 xff0c STM32 芯片 的 GPIO 引脚与外部设备连接起来 x
  • 一步步CEF(2)之编译ceflicent

    一步步CEF xff08 1 xff09 之编译libcef dll wrapper lib已经提供了c 43 43 的静态库 xff0c 这次要将cefclient编译出来 这里要说明一下 xff0c 如果仅仅将cefclient编译的话

随机推荐