基于用户的协同过滤算法

2023-11-06

计算用户相似度和用户对未知物品的可能评分

基于用户的协同过滤算法主要包括两个步骤。
(1) 找到和目标用户兴趣相似的用户集合。
(2) 找到这个集合中的用户喜欢的，且目标用户没有听说过的物品推荐给目标用户。

例如现在有A、B、C、D四个用户，分别对a、b、c、d、e五个物品表达了自己喜好程度（通过评分高低来表现自己的偏好程度高低），现在要为C用户推荐物品：
1、构建用户物品评分表
在这里插入图片描述

2、相似度计算
计算用户相似度的方法很多，这里选用余弦相似度
在这里插入图片描述

给定用户u和用户v，令N(u)表示用户u曾经有过正反馈的物品集合，令N(v)为用户v曾经有过正反馈的物品集合。

在这里插入图片描述

可以看出D用户与C用户相似度最大。
3、计算推荐结果
用户C评分的物品是b和e，下面计算用户C对物品a,c,d的偏好程度:
在这里插入图片描述
参考代码：

import math
class UserCF:
    def __init__(self):
        self.user_score_dict = self.initUserScore()
        self.users_sim = self.UserSimilarity()

    # 初始化用户评分数据
    def initUserScore(self):
        user_score_dict = {"A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
                           "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d": 0.0, "e": 3.5},
                           "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0., "e": 3.0},
                           "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.50, "e": 3.0}}
        return user_score_dict

 # 计算用户之间的相似度,采用的是遍历每一个用户进行计算
    def UserSimilarity(self):
        W = dict()
        for u in self.user_score_dict.keys():
            W.setdefault(u,{})
            for v in self.user_score_dict.keys():
                if u == v:
                    continue
                u_set = set( [key for key in self.user_score_dict[u].keys() if self.user_score_dict[u][key] > 0])
                v_set = set( [key for key in self.user_score_dict[v].keys() if self.user_score_dict[v][key] > 0])
                W[u][v] = float(len(u_set & v_set)) / math.sqrt(len(u_set) * len(v_set))
        return W  

    # 预测用户对item的评分
    def preUserItemScore(self, userA, item):
        score = 0.0
        for user in self.users_sim[userA].keys():
            if user != userA:
                score += self.users_sim[userA][user] * self.user_score_dict[user][item]
        return score

    # 为用户推荐物品
    def recommend(self, userA):
        # 计算userA 未评分item的可能评分
        user_item_score_dict = dict()
        for item in self.user_score_dict[userA].keys():
            if self.user_score_dict[userA][item] <= 0:
                user_item_score_dict[item] = self.preUserItemScore(userA, item)
        return user_item_score_dict

if __name__ == "__main__":
    ub = UserCF()
    print(ub.recommend("C"))

spyder实验结果：

{'a': 2.8577380332470415, 'c': 1.8371173070873839, 'd': 4.286607049870562}

注：计算C和A之间的相似度（未经过one-hot编码得出的结果，经过one-hot编码得出的结果与实际数据一致）

import math
import numpy as np
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
from scipy.spatial.distance import cosine

data1 = {
    "a":{"A":3.0,"B":4.0,"C":0.0,"D":0.0},
    "b":{"A":4.0,"B":0.0,"C":3.5,"D":4.0},
    "c":{"A":0.0,"B":4.5,"C":0.0,"D":0.0},
    "d":{"A":3.5,"B":0.0,"C":0.0,"D":3.5},
    "e":{"A":0.0,"B":3.5,"C":3.0,"D":3.0}
}
data2 = pd.DataFrame(data1)

x = data2.loc['A',:]
y = data2.loc['C',:]
x = np.mat([x])
y = np.mat([y])
x,y

cosine_similarity(x,y)

1 - cosine(data2.loc['A',:],data2.loc['C',:])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

协同过滤

python

算法

基于用户的协同过滤算法的相关文章

matplotlib：调整图形窗口大小而不缩放图形内容

当您调整图形大小时 Matplotlib 会自动缩放图形窗口中的所有内容通常这是用户想要的但我经常想增加窗口的大小为其他东西腾出更多空间在这种情况下我希望在更改窗口大小时预先存在的内容保持相同的大小有谁知道一个干净的方法来做到这
UnicodeDecodeError：“utf-8”编解码器无法解码位置 14 中的字节 0xb9：起始字节无效

我正在使用 Django REST 进行文件上传测试 Python3 6 2Django1 11djangorest框架 3 6 4Excel OSX 15 38 170902 操作系统 10 12 6 过去使用普通照片文件可以成功完成此操
Pygame 让精灵按照给定的旋转行走

很久以前我做了一个Scratch脚本我想用Pygame将其转换为Python 有很多示例显示图像的旋转但我想知道如何更改精灵的旋转以使其沿给定方向移动而不更改图像这是我的暂存代码这是我的 Pygame 精灵类 class Star
Visual Studio Code：如何使用参数调试 Python 脚本

我正在使用 Visual Studio Code 来调试 Python 脚本下列的本指南 https code visualstudio com docs python debugging 我在中设置了参数launch json file
如何使用 Twython 将 oauth_callback 值传递给 oauth/request_token

Twitter 最近刚刚强制执行以下规定 1 您必须通过oauth callbackoauth request token 的值这不是可选的即使您已经在 dev twitter com 上设置了一个如果您正在执行带外 OAuth 请通
Scrapy Splash，如何处理onclick？

我正在尝试抓取以下内容我能够收到响应但我不知道如何访问以下项目的内部数据以抓取它我注意到访问这些项目实际上是由 JavaScript 和分页处理的这种情况我该怎么办下面是我的代码 import scrapy from scrapy
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
将相同的 Patch 实例添加到 matplotlib 中的多个子图中

我正在尝试将补丁的相同实例添加到 matplotlib 中的多个轴这是最小的例子 import matplotlib pyplot as mpl plt import matplotlib patches as mpl patches f
在 Python 中使用类作为命名空间是个好主意吗

我正在将一堆相关的东西放入一个类中主要目的是将它们组织到命名空间中 class Direction north 0 east 1 south 2 west 3 staticmethod def turn right d return tu
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以
Python 在 64 位 vista 上获取 os.environ["ProgramFiles"] 的错误值

Vista64 计算机上的 Python 2 4 3 环境中有以下2个变量 ProgramFiles C Program Files ProgramFiles x86 C Program Files x86 但是当我运行以下命令时 impo
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
Python Tkinter 网格复选框

我想知道是否有一种简单的方法可以使用 Tkinter 创建复选框网格我正在尝试制作一个由 10 行和 10 列即 100 个复选框组成的网格以便每行只能选择两个复选框编辑我正在使用带有spyder的python 2 7 到目前为
向结构化 numpy 数组添加字段

将字段添加到结构化 numpy 数组的最简洁方法是什么是否可以破坏性地完成或者是否有必要创建一个新数组并复制现有字段每个字段的内容是否连续存储在内存中以便可以有效地完成此类复制如果您使用 numpy 1 3 还有 numpy li
访问影子 DOM 中的元素

是否有可能查找 Shadow DOM 中的元素与蟒蛇硒示例用例我有这个input with type date
gnuplot：第 1 行：无效命令

stackoverflow 上可爱的人们大家好我正在尝试使用 gnuplot 绘制数据我首先阅读表格并提取我想要的数据我将此数据写入 dat 文件截至目前我只是尝试通过命令行绘制它但会添加必要的代码以在 python 脚本工作后
AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题这是我在js中的实现附加 iv 与加密消息并使用 base64 进行编码
具有重复值的 Sqlite 列

就说专栏吧aSQLite 数据库的非常重复始终有相同的 4 个值其他值可能稍后出现但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim
Pandas 2 个字段中唯一值的数量

我正在尝试查找覆盖 2 个字段的唯一值的数量例如一个典型的例子是姓氏和名字我有一个数据框当我执行以下操作时我只获取每列的唯一字段数在本例中为最后一个和第一个不是复合体 df Last Name First Name nu
如何从Python枚举类中获取所有值？

我正在使用 Enum4 库创建一个枚举类如下所示 class Color Enum RED 1 BLUE 2 我要打印 1 2 作为某处的列表我怎样才能实现这个目标您可以执行以下操作 e value for e in Color

随机推荐

vue2 vue-amap plugin ControlBar插件使用和高德3D效果

网络上有不少vue amap的插件使用教程我看了许多都没有适用的要高德3D效果必须用到ControlBar插件核心是viewMode的开启和ControlBar插件的配置以下是我试出来的使用方法在main js中配置全局vue a
基于89C51单片机的智能小车——06.测速小车

测速模块用途广泛用于电机转速检测脉冲计数位置限位等接线 VCC 接电源正极3 3 5V GND 接电源负极 DO TTL开关信号输出 AO 此模块不起作用测试原理和单位换算轮子走一圈经过一个周长 C 2x3 14x半径 3
5. 数学导论 - 图论（图的概念）

文章目录图论 Hi 大家好我是茶桁今天这节课呢内容非常的少少到你可能会认为我偷懒了还真不是因为就目前基础来说图论这一节尚且没有太多可讲的东西重点是带大家混个脸熟那么多高强度内容之后就当给自己放个假吧图论前面说过这
19.学习Camera之——相机驱动层–V4L2框架解析

相机驱动层 V4L2框架解析一概览相机驱动层位于HAL Moudle与硬件层之间借助linux内核驱动框架以文件节点的方式暴露接口给用户空间让HAL Module通过标准的文件访问接口从而能够将请求顺利地下发到内核中而在内
hdu 1827(tarjan)

先用tarjan缩点然后入度为0的点就是必须要选择点同时也是最小的情况 Summer Holiday Time Limit 10000 1000 MS Java Others Memory Limit 32768 32768 K Java
flowable 多数据源

目录前言一多数据源二测试 1 测试接口 1 不带事务 2 加上事务三解决方法 1 开启新事物 2 重写事务总结前言在springboot中使用flowable 此时flowable默认使用spring中的数据源我这里f
ERP常用词汇中英文对照

ERP常用词汇中英文对照 2007年10月24日星期三 15 23 A gt gt ABC Classification ABC分类法对于库存的所有物料按照全年货币价值从大到小排序然后划分为三大类分别称为A类 B类和C类 A类物料
Fastjson 全局日期序列化设置导致 JSONField 无效（Java）

Fastjson 全局日期序列化设置导致 JSONField 无效 Java 在 Java 开发中 Fastjson 是一个流行的 JSON 处理库它提供了强大的功能和灵活性其中一个常见的需求是将 Java 对象序列化为 JSON 字符
linux文件时间戳（atime, mtime, ctime）

简介在linux系统创建一个文件后使用stat lt 文件名 gt 命令行查看文件状态总是能看到 3 个时间戳如下图所示从上图可以看到 touch命令创建文件abc后使用 stat abc命令行查看abc文件的状态显示了3个时
常用命令行指令

文章目录 1 快速重命名多份文件 2 将mkv文件转为MP4 3 cd命令 4 pip常用命令 5 常用命令大全 1 快速重命名多份文件在想要修改的文件夹下方按住shift键右击鼠标打开PowerShell ls mp4 mv De
由于找不到MSVCR120.dll,无法继续执行代码，重新安装程序可能会解决此问题。

今天安装mysql的时候遇到了一个bug 如下图所示这是因为没有安装如下软件导致的点击如下链接下载vcredist 下载 vcredist 地址 https www microsoft com zh CN download detai
NS3初探

NS3初探文章目录 NS3初探一简介二 NS3重要概念 1 节点 Node类 2 信道 Channel类 3 网络设备 NetDevice类 4 应用程序 Application类 5 拓扑帮助 topology helper 6
CAM，PradCAM，layer CAM（可解释性分析方法）

目录 1 CAM 1 1作用 1 2应用实例 1 3CAM的特点 1 4CAM的思路 1 5CAM的缺点 2 GradCAM 2 1和GAM的区别及思路 2 2应用面 2 3一个延深解决模型偏见 2 4缺点 3 Grad CAM 4 Sc
R语言基于R6的面向对象编程

R的极客理想系列文章涵盖了R的思想使用工具创新等的一系列要点以我个人的学习和体验去诠释R的强大 R语言作为统计学一门语言一直在小众领域闪耀着光芒直到大数据的爆发 R语言变成了一门炙手可热的数据分析的利器随着越来越多的工程背景
在Altium Designer设计时候出现的Unknown Pin:Pin XX问题

之前在布线时候发现一个元器件没有而且一直提示不知道引脚以为是网络标号没有弄后来看了一下网络标号也有然后系统还是提示不知道该引脚如图所示然后就按照网上方法把全部网络标号删去了重新弄也没有用原理图也检查了一遍这个元器件的原理图也
华为首席开源联络官任旭东：深耕基础软件开源，协同打造数字世界根技术

整理巫柔颖开源是迄今为止最先进最广泛最活跃的协同创新模式通过汇聚创新资源构建信任环境促进知识智慧技术成果等的共享加速创新要素高效流动产生更大价值已经成为软件技术升级和产业发展的主要模式是推动科技创新的核心动力与重
scala集合和java集合的转换-List

scala集合和java集合的转换 List scala的List要想转换成java的list 需要导入对应的类scala collection JavaConverters import java lang util import com
swift无法创建空init构造函数，如何给类变量赋予nil空值

今天学swift的时候遇到一个问题无法创建一个空的类对象最主要的是无法让对象的类变量为空比如创建一个Person类年龄age用Int属性但是age默认是0 不是空值nil 以下代码给出了解决方案 import Foundatio
SSH远程登录原理与运用

SSH是每一台Linux电脑的标准配置随着Linux设备从电脑逐渐扩展到手机外设和家用电器 SSH的使用范围也越来越广不仅程序员离不开它很多普通用户也每天使用 SSH具备多种功能可以用于很多场合有些事情没有它就是办不成本文是
基于用户的协同过滤算法

计算用户相似度和用户对未知物品的可能评分基于用户的协同过滤算法主要包括两个步骤 1 找到和目标用户兴趣相似的用户集合 2 找到这个集合中的用户喜欢的且目标用户没有听说过的物品推荐给目标用户例如现在有A B C D四个用户分别对a b

基于用户 的协同过滤算法

计算用户相似度和用户对未知物品的可能评分

注：计算C和A之间的相似度（未经过one-hot编码得出的结果，经过one-hot编码得出的结果与实际数据一致）

基于用户 的协同过滤算法 的相关文章

随机推荐

热门标签

基于用户的协同过滤算法

基于用户的协同过滤算法的相关文章