推荐系统用户画像标签聚类个性化搜索

2023-11-10

最近在做短视频推荐，和别的部门配合着做，我们部门做用户画像这一部分。回头看看，我们部门以前做的用户画像只能称之为“所谓的用户画像”。如果一个人不懂用户画像还好指挥来指挥去真的让人无言，不知道其他公司的有没有这样的人儿那，哈哈，扯远了，言归正传。这篇文章只是对文献[1]的一个总结与实践,像我这种才学浅显的人只能照猫画虎了。
1、标签&标签问题
用户可以对物品打标签，这些标签存在：
（1）标签冗余。比如“父亲”与“爸爸”标签是一个意思。
（2）标签语意不明。如“苹果”可以是苹果手机、水果，也可能是纽约。
（3）各种噪音。拼写错误等。
既然存在问题，有没有能够缓解这种问题的办法呢？聚类就是其中的方法之一
2、标签聚类&聚类算法
“用聚类就行了，多简单！”总是说这句话的人要么是大牛，要么是浅薄。从概率上讲，大牛总是少的，浅薄总是多的，哈哈，老想扯点题外话，收拢回来。
聚类为什么可以缓解标签冗余、模糊和噪音等问题那。
（1）通过聚类，冗余的标签可能归结为一个簇。例如“父亲”与“爸爸”都是一个簇里的标签
（2）某一个标签语义可以通过簇里其他标签的语义加以明确。例如有一个簇：橘子，香蕉，苹果。在该簇中，苹果就是水果。
…………
说道聚类，就会涉及聚类算法。聚类算法很多，这里简单说一下“层次聚类算法”层次聚类PDF。这里借助一个例子简单说一下层次聚类。
这里写图片描述
如上图所示为层次聚类算法结果图。最上边的水平轴代表了相似度（combination similarity）。举例来说，当我们选择相似度为0.4作为分裂点的时候，我们就可以得到24个聚类簇。选择相似度0.1作为分裂点，就可以得到12个聚类簇。层次聚类不需要事先设定聚类的个数。
3、基于标签的个性化搜索算法
现在，标签已经聚类完成，那么则么计算用户与每个标签簇的关系，物品与每个标签簇的关系？
对于用户u对簇c的兴趣可以计算：
这里写图片描述
其中A表示<用户、物品、标签>记录条数，R表示物品（资源）集合，简单地说，就是用户大的标签中属于簇c的个数比上用户打的标签的总个数。
物品r对簇c的关系可以计算：

有了用户与标签簇的关系以及物品与标签簇的关系，那么就可以计算出用户对物品的感兴趣程度：
这里写图片描述
多说一句，计算出relevance（u，r）后就可以作为一种推荐粗过滤的线下模型，为线上推荐提供候选数据。
那么接下来的问题就是，如果用户输入一个标签，怎样根据用户画像为用户返回个性化推荐呢？
对于一个搜索q来说，可以计算出q与物品r的相似度，然后降序排列得到返回列表rankscore（q，r），如果把用户和物品之间的相似度考虑进来，对rankscore（q，r）进行重新排序，则可以返回个性化搜索结果：
这里写图片描述
到此，我们把用户profile，标签聚类，查询q作为输入，返回了个性化搜索结果p_rankscore

[1]Personalization in Folksonomies Based on Tag Clustering
Jonathan Gemmell, Andriy Shepitsen, Bamshad Mobasher, Robin Burke

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

个性化搜索

聚类

随机推荐

rp学习1---web页面左侧导航栏收缩

一首先使用几个矩形框将所有的导航栏按照需要和层级画出来如下二将父菜单和子菜单分别转化为动态面板具体转化动态面板方式如下选择要转为面板的部分如两个子菜单鼠标画框框住两个菜单即可会将框内的所有内容作为一个面板右击三选择父
算法训练营第三十二天（8.16）

目录 Leecode 435 Non overlapping Intervals Leecode 763 Partition Labels Leecode 56 Merge Intervals Leecode 435 Non overlap
pycharm问题求解

为什么我的pycharm下面会弹出在 init 中找不到某个函数我不知道在哪里设置了这个就都成这个样子了重新安装一个模组可以暂时解决这个问题但是切个屏就又变成这样了正常的好像是这样的求解
graph 图数据结构

树和图辨析 1 树的父节点和子节点之间是一条路单向可达 2 图的的节点之间存在多条路可达基本概念 1 顶点 2 边 3 邻居节点只有一条边连接的顶点 4 度 degree 一个顶点有几条边就有几度图的区分 1 无向图边没有方
【Shell】expect解决脚本中交互时自动输入的问题

日常和shell相关的工作中经常遇到要在脚本中连接其他服务器进行文件传输等操作这些命令通常会要求和用户交互输入验证信息那么在脚本中如何实现自动输入口令之类的信息这里就要用到expect 以ubuntu20为例首先要安装这个软件
Unity Animancer插件（三）运动

一根运动 Animancer的根运动系统与原生的工作原理完全相同但我们可以通过继承Transition类型或实现ITransition接口来将额外的数据与动画绑定从而更方便地控制根运动在下面这个示例中我们通过自定义的Transi
从N个整数中判断是否有三个整数能组成三角形

解决这个问题可以用斐波那契数列 Fibonacci sequence 原因斐波那契数列中的数是不可能组成三角形的而我们只要在这些数列里面加一个数就可以有一个三角形可以组成有了这个原因我们就可以写一个非常快速就可以判断出结果的函数如
C#：递归汉诺塔

一运行效果截图二实验要求如果n 1 直接将金片从A针移到C针上函数输出 Form A to C 如果n gt 1时移动过程分解为以下几个步骤 1 将A上的n 1片金片借助C针移到B针上 2 把A针上剩下的一片金片由A针移到C针上
stomp.min.js（stomp协议的客户端脚本）、sockjs.min.js（SockJS的客户端脚本）以及jQuery

stomp min js stomp协议的客户端脚本 sockjs min js SockJS的客户端脚本以及jQuery 点击打开链接
[ C++ ] — 智能指针

一三种智能指针 auto ptr unique ptr shared ptr auto ptr是C 98提供的方案 C 11已经将其摒弃以下只是示例实际不要使用auto ptr 使用new和delete管理动态内存常出现的问题 1 忘
STM32MP1开发环境搭建

STM32MP1 wiki教程 stm32mpu 按照教程的介绍开发MPU需要在linux环境下一般选择在VMware虚拟机环境下安装Ubuntu 安装步骤 1 安装VMware 我安装的是VMware 10 0 0 链接 https
jQuery使用手册

官方网站 http jquery com jQuery是一款优秀js开发库类特别是对css和XPath的支持使我们写js变得更加方便如果你不是个js高手又想写出优秀的js效果 jQuery可以帮你达到目的下载地址 Starterk
C语言数据结构问题：停车场问题（栈和队列）

试题描述设停车场只有一个可停放几辆汽车的狭长通道只有一个大门可供汽车进出汽车在停车场内按车辆到达的先后顺序依次排列若车场内已停满几辆汽车则后来的汽车只能在门外的便道上等候一旦停车场内有车辆开走则排在便道上的第一辆汽车即可进入
ARP（地址解析协议）协议和RARP协议（逆地址解析协议）

ARP协议地址解析协议及ARP 是根据IP地址获取物理地址的一个TCP IP协议主机发送信息是将包含将包含目标IP地址的APR请求广播到局域网络上的所有主机并接收返回消息以此确定目标的物理地址受到返回消息的时候将IP地址和物理地
接口自动化之测试数据动态生成并替换

一测试数据 1 随机库random 查看内置random方法该方法自行学习不再介绍 show 2 Faker库 pip install faker showHttps github com joke2k faker 3 应用到项目中
Java 反射机制与工厂设计模式

什么是反射 Java反射机制是在运行状态中对于任意类都能知道这个类的全部属性和方法对于任意对象都能够调用它的任何一个方法或属性这种动态获取的信息以及动态调用对象的方法的功能称为Java语言的反射机制 Class类 Class 是
MPI与main()程序中的其他函数执行次数

我原先以为只有在MPI代码区域即MPI Init argc argv 到MPI Finalize 中的代码才会涉及到进程通信的问题但实际上在MPI区域外的代码依然受到影响执行的次数与开启的进程数有关为此可以使用MPI 秩 rank
AttributeError: 'Function' object has no attribute 'fn' [in caffe]

n global pool prob3 L Sigmoid n global pool up3 name global pool prob3 ntop 0 top global pool up3 n att repmat3 L Tile n
智能语音技术栈

识别原理硬件数据采集软件数据处理目前主流的开源平台包括CMU Sphinx HTK Kaldi Julius iATROS CNTK TensorFlow等 CMU Sphinx是离线的语音识别工具支持DSP等低功耗的离线应用场景
推荐系统用户画像标签聚类个性化搜索

最近在做短视频推荐和别的部门配合着做我们部门做用户画像这一部分回头看看我们部门以前做的用户画像只能称之为所谓的用户画像如果一个人不懂用户画像还好指挥来指挥去真的让人无言不知道其他公司的有没有这样的人儿那哈哈扯远了言归正传

推荐系统 用户画像 标签聚类 个性化搜索

推荐系统 用户画像 标签聚类 个性化搜索 的相关文章

随机推荐

热门标签

推荐系统用户画像标签聚类个性化搜索

推荐系统用户画像标签聚类个性化搜索的相关文章