用户标签有哪些类型,如何进行科学分类?

2023-05-16

 标签的分类,是理解用户标签、理解用户画像的基础。优秀的标签分类,将使得标签画像系统易于用户的使用。

本篇文章和大家简单介绍一下标签数据的分类。

按照不同的分类方法,标签的分类也自然不同。本文主要介绍几种最常规的分类方式,包括按照来源方式、按照业务场景、按照标签的数据类型等。

01

按照来源分类

首先是按照标签的来源分类。主要分为以下的几类:

(1)用户自己填写的数据生成的标签

这部分标签是用户在注册产品或者在各个模块自行填写的信息。一般就是【性别】、【生日】、【真实姓名】、【居住地】、【身份证】等

例如下图是联想的官网,用手机号注册成功后,进入个人信息页面,可以看到各种信息的填写。

互联网早期,很多网站的注册比较麻烦,必填的信息项目较多,因此能拿到的数据也就多。但随着互联网红利的消失,用户的获取愈发困难,在注册阶段收集用户信息变得越来越简洁,目前绝大部分网站的收集就只保留了手机号,用手机号及验证码即可完成注册。后续则通过一些积分、优惠等方式激励大家主动填写。

【优缺点】这部分数据用来做标签,往往是最基础的。但存在的最大的问题是标签覆盖度过低,有意愿填写的用户常常比例不过半。而且对于部分敏感信息,例如身份证、地址等,如果逼迫用户填写,用户经常会填写虚假信息。这对于后续标签画像而言,不太好用。除非是12306这种强制性的网站,对身份信息能保障。

(2)通过统计用户行为,生成的统计标签

这类标签指标是最多的。

比如可以根据订单表,统计用户的订单金额;可以根据搜索表,统计用户的搜索次。

【优缺点】这部分数据用来做标签,是比较客观的,用户的行为不会说谎。但存在的一个问题是,要对标签画像系统产生价值,需要较多的逻辑处理。例如,想给用户打一个【购买力高低】的标签,是统计最近7天的成交金额,还是最近30天的?是按照订单口径还是金额口径?是大于1万算高,还是大于1000就算高?这里都需要大量的逻辑。如果只是一个统计值,只能算是一个宽口径的半加工的标签,真正用起来的时候,存在一些障碍。

(3)通过算法生成的标签

算法,很万能。

这玩意就是,很多场景不得不用。比如,想打一个【准妈妈】标签。这时,你咋办?你想尽各种逻辑,比如最近有搜索宝宝装行为的、最近有买孕妇服的……很多特征都能反映【准妈妈】的特点,但是通过简单的逻辑,是无法实现的。这个时候,就扔给算法团队吧……他们会基于大量的特征,训练模型,最后打上【准妈妈】的标签。

【优缺点】算法标签的缺点很突出,就是费时费力,做一个标签的时间可能要一两个月,做统计标签都做了几十个了……但如果算法靠谱,效果常常也不错,对业务的价值往往也比较大。如果公司算法资源富裕,那就做吧!当然,要有业务价值哦~

(4)通过第三方采购、积累的

土豪的方式很简单,买!

比如采购点身份证信息、采购点用户的征信信息等等。

【优缺点】优点就是省事。缺点就是费钱,而且能买的标签通常都是比较通用的,一些个性化的,例如网站的访问频次等,也是不太好采购的。当然还涉及数据安全的风险。

02


按照数据类型分类

按照数据类型,主要分为以下几类:

(1)数值型标签

刚才上文提到的【用户最近7天购买金额】、【用户近1天浏览天数】等,这些标签都是按照一定的规则统计生成的,均是数值型标签。其实本质上和指标没有太大区别。

组成公式是:【时间范围】+【行为方式】+【统计方式】。

下图是达摩盘标签中的部分统计标签:


时间范围不说了,行为方式表示这个指标的含义,例如成交、搜索、点击等。统计方式是【计数】、【求和】、【最值】等

【优缺点】按照不同的时间范围、不同的行为方式、不同的统计方式,可以组成大量的标签。数量虽多,但是价值密度很低。因此,在成熟的标签系统中,这类标签不会大量在计算,往往是用户创建了啥就用啥。优点是比较容易生成。

(2)单值型枚举标签

这种标签可以是用户自己填写生成的,也可以是通过数值型标签进行加工,或者算法,生成的。

这类标签的最大特征,就是一个用户在这个标签中,只能有一个选项值。而且,和数值型标签的区别在于,单选型标签的选项值是可穷举的,是离散的。

例如:【用户的生命周期】,用户肯定是处于【成长期】、【成熟期】、【衰退期】、【沉睡期】其中的一个,不可能属于两个或者多个。

例如:【性别】

(3)多值型枚举标签

和单选型标签的区别就在于,一个用户可以有多个值。

同样,复选型标签也是离散值,选项是可穷举的。

例如:【用户的收货城市】,用户可以有多个城市

(4)文本型标签

这类标签最大的特征,是不连续、且不可穷举。

例如,【用户常用热搜词】,每个用户都可以有自己的常用热搜词,但热搜词的数量是巨大的,不能像单选型标签或者复选型标签那样,几个、甚至最多几十个选项,就能覆盖所有。


为啥要进行这个分类呢?

其实主要是在标签系统中,用标签筛选人群的时候有用。不同数据类型的标签,在前端的交互是一定要有区分的。这个后续详细展开。

03


按照业务场景分类

这种分类方式,根据各自业务的不同,就见仁见智了。

这个分类,主要是用于标签系统的标签管理,按照业务方式进行组织标签类别,有助于用户的便捷使用。

下面是阿里达摩盘的标签分类,仅供参考

以下是某司内部的标签分类:

以上。




●解一道反常的Pandas题●12000+字超详细 SQL 语法速成!
后台回复“入群”即可加入小z干货交流群
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用户标签有哪些类型,如何进行科学分类? 的相关文章

随机推荐

  • 匿名飞控(拓空者)屏蔽遥控

    目录 一 理论程序中需要修改的部分 二 实操1 注意2 标记更改前更改后 3 CH N 赋值更改前更改后结果 三 注意 一 理论 程序中需要修改的部分 1 xff0c 先找到所有rc loss的标记 xff0c 赋值0 xff0c 不要让他
  • 【Python】使用VTK实现3D可视化医学图像(格式.nii.gz)

    需要安装依赖 itk 和 vtk xff0c 效果如下 代码 span class token keyword import span itk span class token keyword from span vtkmodules sp
  • 【vite】配置vite打包入口

    项目目录 vite的配置都在根目录下面的vite config ts里面 xff0c 在没有对其进行打包配置时 xff0c 默认的打包的入口就是根目录的 index html 这时候我们直接运行 npm run build就会打包相应的文件
  • Tomcat彻底卸载干净方法

    Tomcat软件自带卸载工具无法将自身卸载干净 xff0c 卸载后注册表 服务项仍然存在 xff0c 导致后续安装的新版本Tomcat无法正常使用 提供卸载方法如下 xff1a xff08 1 xff09 直接删除Tomcat安装所处的总文
  • Java 对象转化为Map

    方式一 利用FastJson 把对象转化为Map 64 MethodName getUserInfoDataByUserId 64 Description 根据useId查询用户信息 xff0c 封装成map key xff1a 属性名 x
  • Linux命令之mv命令

    mv命令是move的缩写 xff0c 可以用来移动文件或者将文件改名 xff08 move rename files xff09 命令格式 mv 选项 源文件或目录 目标文件或目录 1 当mv命令中的第二个参数类型 xff08 目标 xff
  • Linux查看当前时间

    一 查看和修改Linux的时区 1 查看当前时区 命令 xff1a date R 2 修改设置Linux服务器时区 方法 A 命令 xff1a tzselect 方法 B 仅限于RedHat Linux 和 CentOS 命令 xff1a
  • 如何查看redis版本号

    Windows下查看redis版本号 1 打开redis所在目录启动 redis server 服务器端 2 启动 redis cli 客户端 3 客户端输入 xff1a info 结果如下 xff1a linux下查看redis的版本号
  • 三个练手的软件测试实战项目(附全套视频跟源码)偷偷卷死他们

    项目一 xff1a 12306抢票项目 项目测试目的 学会Selenium定位web元素的方法 熟练浏览器调试工具使用 项目主体步骤 1 xff09 人工走一遍流程 xff0c 对自动化的流程心中有数 2 xff09 按步骤拆分 xff0c
  • 基于LSTM的多变量温度预测(python从入门到入坑)

    基于LSTM的多变量温度预测 xff08 python xff09 我保证他能够运行 xff0c 而且结果能够让你满意 xff08 如果你和我一样都是一个新手的话 xff09 这里写目录标题 基于LSTM的多变量温度预测 xff08 pyt
  • 安装RabbitMQ出现Plugin configuration unchanged.问题

    安装RabbitMQ出现Plugin configuration unchanged 问题 rabbitmq server和opt版本 出现问题 xff1a 在安装RabbitMQ并配置好环境之后运行命令rabbitmq plugins e
  • selenium之 如何控制网页内嵌div中滚动条的滚动

    http blog csdn net huilan same article details 52131277 很多人疑惑怎么用selenium控制网页div中滚动条的滚动 xff0c 其实这个问题很简单 xff0c 用JS很简单就可以实现
  • Mysql如何设置id自增

    xff08 1 xff09 设置自增 方案一 xff1a CREATE TABLE IF NOT EXISTS user id INT UNSIGNED AUTO INCREMENT name VARCHAR 100 NOT NULL se
  • Centos安装RabbitMQ超详细(必须收藏)

    最近搞了台liunx xff08 centos xff09 服务器 xff0c 想玩一下rabbitMQ 但是发现csdn没有一个详细或者便捷的安装流程 xff0c 特此写了这么一篇文章 xff01 记得三连 万分感谢 xff01 首先Wi
  • Mysql占用CPU过高排查过程及可能优化方案

    1 查看生产DB服务器top列表 xff0c 执行 top 命令 2 使用root用户登录mysql 执行 show full processlist 查看慢查询 xff0c 反复执行 xff0c 如果发现一直有select 查询语句存在
  • SQLServer2019安装(Windows)

    目录 一 SQLServer2019下载 1 官网下载地址 2 下载安装包 2 1 选择Developer版本 立即下载 2 2 选择下载位置 3 安装 3 1 打开 SQLServer2019 x64 CHS Dev iso
  • 香橙派4在armbian上应用自启动设置

    编辑了一个qt界面 需要设置开机启动 xff0c 费了九牛二虎之力 xff0c 终于搞定了 设置开机显示命令行 开机不显示图形界面 xff0c 直接显示命令行的操作有两种方法 xff1a 多用户方法 sudo systemctl set s
  • vscode 中git解决冲突,合并代码的两种方法

    一 报错信息 有文件冲突的话 xff0c 会报错 xff1a git merge pre span class token operator span master span class token comment 合并 pre maste
  • 用Python爬取淘宝4403条大裤衩数据进行分析,终于找到可以入手的那一条

    炎炎夏日 xff0c 长裤已难以满足广大男生的需求 xff0c 为了在搬砖和摆摊的过程中增添一丝舒适感 xff0c 他们开始寻找一种神奇的存在 大裤衩 J哥在种菜的这些日子里也日益感受到大裤衩的重要性 xff0c 于是 xff0c 默默打开
  • 用户标签有哪些类型,如何进行科学分类?

    标签的分类 xff0c 是理解用户标签 理解用户画像的基础 优秀的标签分类 xff0c 将使得标签画像系统易于用户的使用 本篇文章和大家简单介绍一下标签数据的分类 按照不同的分类方法 xff0c 标签的分类也自然不同 本文主要介绍几种最常规