clickhouse 数据模型之有序漏斗分析(windowFunnel)

2023-10-26

什么是有序漏斗,有序漏斗需要满足所有用户事件链上的操作都是逡巡时间先后关系的,且漏斗事件不能有断层,触达当前事件层的用户也需要经历前面的事件层

介绍

windowFunnel
搜索滑动时间窗中的事件链,并计算从链中发生的最大事件数。

该函数采用如下算法:

该函数搜索触发链中的第一个条件并将事件计数器设置为1。 这是滑动窗口启动的时刻。

如果来自链的事件在窗口内顺序发生,则计数器将递增。 如果事件序列中断,则计数器不会增加。

如果数据在不同的完成点具有多个事件链,则该函数将仅输出最长链的大小。

语法

windowFunnel(window, [mode])(timestamp, cond1, cond2, ..., condN)

参数

window — 滑动窗户的大小,单位是秒。
mode - 这是一个可选的参数。
‘strict’ - 当 ‘strict’ 设置时,windowFunnel()仅对唯一值应用匹配条件。
timestamp — 包含时间的列。 数据类型支持: 日期, 日期时间 和其他无符号整数类型(请注意,即使时间戳支持 UInt64 类型,它的值不能超过Int64最大值,即2^63-1)。
cond — 事件链的约束条件。 UInt8 类型。

返回值

滑动时间窗口内连续触发条件链的最大数目。
对选择中的所有链进行了分析。

类型: Integer.

列子

-- 创建一张用户行为表, 
CREATE TABLE default.user_action
(
    `uid` Int32,
    `event_type` String,
    `ctime` DateTime 
)
ENGINE = MergeTree()
PARTITION BY uid
ORDER BY uid
SETTINGS index_granularity = 8192

-- 插入数据
INSERT INTO default.user_action 
VALUES
(1000,'书城',toDateTime('2020-05-20 11:00:00')),
(1000,'阅读',toDateTime('2020-05-20 12:00:00')),
(1000,'点击',toDateTime('2020-05-21 15:00:00')),
(1000,'下单',toDateTime('2020-05-22 01:00:00')),
(1000,'支付',toDateTime('2020-05-23 12:00:00')),
(1002,'书城',toDateTime('2020-05-20 11:00:00')),
(1002,'下单',toDateTime('2020-05-20 15:00:00')),
(1002,'支付',toDateTime('2020-05-20 18:00:00')),
(1003,'书城',toDateTime('2020-05-20 11:00:00')),
(1003,'阅读',toDateTime('2020-05-21 12:00:00')),
(1003,'点击',toDateTime('2020-05-21 16:00:00')),
(1004,'书城',toDateTime('2020-05-20 11:00:00')),
(1004,'阅读',toDateTime('2020-05-20 11:00:00')),
(1004,'点击',toDateTime('2020-05-20 16:00:00')),
(1005,'书城',toDateTime('2020-05-20 11:00:00')),
(1005,'阅读',toDateTime('2020-05-20 11:00:00')),
(1005,'点击',toDateTime('2020-05-20 15:00:00')),
(1005,'下单',toDateTime('2020-05-20 16:00:00')),
(1006,'书城',toDateTime('2020-05-20 11:00:00')),
(1006,'阅读',toDateTime('2020-05-20 09:00:00')),
(1006,'点击',toDateTime('2020-05-20 12:00:00')),
(1006,'下单',toDateTime('2020-05-20 13:00:00'));

-- 查询
 SELECT 
    uid,
    windowFunnel(6880000000)(ctime, event_type = '书城',event_type = '阅读', event_type = '点击', event_type = '下单', event_type = '支付') AS levelnum
FROM default.user_action  
GROUP BY uid
ORDER BY uid ASC  


在这里插入图片描述

模型

继续使用上面的测试数据,通过数组的高阶函数对上述结果数据进行二次加工处理以获取完整漏斗展示效果。

SELECT level_index,count(1) FROM
(
    SELECT  uid, 
        arrayWithConstant(level, 1) levels, 
        arrayJoin(arrayEnumerate( levels )) level_index
      FROM (
         SELECT 
		    uid,
		    windowFunnel(6880000000)(ctime, event_type = '书城',event_type = '阅读', event_type = '点击', event_type = '下单', event_type = '支付') AS level
		FROM default.user_action  
		GROUP BY uid
		ORDER BY uid ASC  
    )
)
group by level_index
ORDER BY level_index

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

clickhouse 数据模型之有序漏斗分析(windowFunnel) 的相关文章

  • java中值传递和引用传递

    目录 值传递 引用传递 Java 中有两种数据类型 请谈一下值传递与引用传递 Java 中只有值传递么 值传递 package com github hcsp public class Main public static void mai
  • JAVA单元测试框架-6-Enable priority

    1 enabled属性 在Testng中 如果方法前面添加了 Test注释 然后没有其他的属性 那么默认这个用例会被自动运行 当测试用例没有书写完成 或者不想测试时 可以采用注解 Test enable false 来禁止测试用例的执行 E

随机推荐

  • 如何自学图像编程

    如何自学图像编程 现在 图像类信息越来越多了 对图像的编程需求也越来越多 图像类项目的特点是性价比高 单行代码的价格一般是普通的程序的10倍 每行代码能够卖几块钱 很多人把目光放在这个上面 刚才又有网友咨询 做图像要看些什么书 结合我的自学
  • VSCode打开多个文件时实现标签栏多行显示

    默认情况下 VSCode的标签栏是滚动式的 当打开多个文件时是在同一行中显示的 想要选择查看某个文件时很不方便 如果想要实现多行显示标签页 也是可以的 具体方法如下 操作步骤 1 安装Custom CSS and JS Loader插件 2
  • 相关子查询和不相关子查询

    相关子查询 比如 select t id t name t pass from student t where 80 lt select f score from f where f id t id and f name xxx 这就是1个
  • AICG,人工智能自动生成内容——根据文本生成图像,视频,音频

    文章目录 1 什么是AICG 2 Text2Video 3 Text2Image 4 Text2Audio 5 AICG的发展趋势 1 什么是AICG 什么是AICG AICG是指人工智能自动生成内容 通过算法模型 将文本转化为图像 音频
  • [原]通过GitHub Pages建立个人站点(详细步骤)

    1 Git简介 2 为什么使用Github Pages 3 创建Github Pages 3 1 安装git工具 3 2 两种pages模式 3 3 创建步骤 3 4 常用命令 4 使用Jekyll搭建博客 4 1 什么是jekyll 4
  • 【微信小程序】wx.login 和 wx.getUserProfile 同时使用问题

    场景 在使用微信登录时 通常会在调用 wx login 获取 code 后再通过 wx getUserProfile 获取 iv 和 encryptedData 加密数据 一起发到后端进行登录验证 但是 在实际使用中如果在 wx login
  • HTML+CSS实现按钮居中

    居中的方式有很多 这里以button为例 它是一个行内块级元素display inline block 所以处理方式很简单 可以用以下两种方式 方式一 div style text align center div
  • 1116. 打印零与奇偶数

    现有函数 printNumber 可以用一个整数参数调用 并输出该整数到控制台 例如 调用 printNumber 7 将会输出 7 到控制台 给你类 ZeroEvenOdd 的一个实例 该类中有三个函数 zero even 和 odd Z
  • 数据库SQL优化大总结之 百万级数据库优化方案

    网上关于SQL优化的教程很多 但是比较杂乱 近日有空整理了一下 写出来跟大家分享一下 其中有错误和不足的地方 还请大家纠正补充 这篇文章我花费了大量的时间查找资料 修改 排版 希望大家阅读之后 感觉好的话推荐给更多的人 让更多的人看到 纠正
  • 【Xilinx Vivado时序分析/约束系列3】FPGA开发时序分析/约束-保持时间

    目录 基本概念 数据结束时间 Data finish time 时钟到达时间 Clock arrival time 保持时间门限 保持时间余量 Hold Slack 往期系列博客 基本概念 数据结束时间 Data finish time 之
  • win10+中标麒麟双系统安装步骤

    win7 10 中标麒麟双系统安装步骤 场景要求 联想启天M415台机出厂预装的是win10 现在要改成win7和中标麒麟7 0双系统 开机在选择系统界面要有两个系统选择 并且默认进入win7 注 先安装win7 再安装中标麒麟 一开始是用
  • MySQL--order by升序与降序、count计数与子查询

    MySQL order by升序与降序 count计数与子查询 1 创建表格 2 题目部分 1 升序与降序 order by 2 count 计数 3 子查询 3 文末彩蛋 轻松一刻 更多关于数据库知识请加关注哟 若需联系和想安装MySQL
  • 打印预览的时候,总是会多于一个空白页,怎么办?

    media print printTest 要打印的区域 display block width 100 height auto overflow hidden 在页面内加入此样式即可
  • PyTorch-01初见

    PyTorch 01初见 同类框架 PyTorch生态 PyTorch能做什么 1 GPU加速 import torch import time print torch version print torch cuda is availab
  • 零基础!搭建好本地的ChatGPT!

    当搭建好本地的GPT 你可以充分利用OpenAI的功能 无需使用任何魔法 并且免去了许多烦恼和难题 通过魔法访问gpt遇到过很多问题吗 以下是你搭建的本地GPT的一些关键特点 功能全面 你的本地GPT能够使用OpenAI的全部功能 让你体验
  • 11 前端模块化

    文章目录 为什么有前端模块化 以前的解决办法 了解CommonJS es6的模块化 export 导出 import 导入 为什么有前端模块化 首先 如果多人合作开发一个项目 你的a js用了一个变量a 你同事的b js也用了一个变量a 那
  • mybatis学习文档

    mybatis 9 28 环境 JDK1 8 mysql 8 0 16 maven3 6 1 IDEA 回顾 JDBC mysql jave基础 Maven junit 1 简介 1 1 什么是mybatis mybatis是支持普通SQL
  • StackExchange.Redis加锁机制实例

    1 redis下载安装 Github下载地址 https github com MicrosoftArchive redis releases 安装过程不做写明 1 VS引用StackExchange Redis 通过 工具 库程序包管理器
  • 软件测试 - sql - 与数据对话的语言

    初识数据库 一 数据库简介 1 1 常见数据库 1 2 数据库模型 1 3 关系型数据库 二 软件的安装与使用 mysql navicat 2 1 安装 2 2 启动关闭mysql服务 2 3 mysql连接navicat 三 数据库基本概
  • clickhouse 数据模型之有序漏斗分析(windowFunnel)

    什么是有序漏斗 有序漏斗需要满足所有用户事件链上的操作都是逡巡时间先后关系的 且漏斗事件不能有断层 触达当前事件层的用户也需要经历前面的事件层 介绍 windowFunnel 搜索滑动时间窗中的事件链 并计算从链中发生的最大事件数 该函数采