评分算法_协同过滤推荐算法：评分预测准确性评估

2023-11-02

纸上得来终觉浅，绝知此事要躬行 -- 宋.陆游《冬夜读书示子聿》

对于评分预测常用的准确性评测指标是均方根误差RMSE和平均绝对误差MAE。

RMSE: 均方根误差（对大的偏差更敏感）

MAE: 平均绝对值误差

注意：|R|表示数据集合的长度

准确性指标计算函数：

from math import sqrt

def rmse(data):
    length = 0
    _rmse_sum = 0
    for uid, iid, real_rating, pred_rating in data:
        length += 1
        _rmse_sum += (pred_rating - real_rating) ** 2
    return round(sqrt(_rmse_sum / length), 4)

def mae(data):
    length = 0
    _mae_sum = 0
    for uid, iid, real_rating, pred_rating in data:
        length += 1
        _mae_sum += abs(pred_rating - real_rating)
    return round(_mae_sum / length, 4)

def maeAndRmse(data):
    length = 0
    _rmse_sum = 0
    _mae_sum = 0
    for uid, iid, real_rating, pred_rating in data:
        length += 1
        _rmse_sum += (pred_rating - real_rating) ** 2
        _mae_sum += abs(pred_rating - real_rating)
    return round(_mae_sum / length, 4), round(sqrt(_rmse_sum / length), 4)

接下来我们就利用这两个指标来评估我们前面实现User-Based CF和Item-Based CF算法

为了防止过拟合，我们可以将数据集拆分为训练集和测试集来试验：

数据集拆分

data_split函数将ratings.csv数据集按比例拆分为训练集和数据集，这里的拆分逻辑主要考虑的是控制用户数量不变，从每位用户的评分数据中按比例抽取，

这样能保证训练集和测试集用户是一致的，但是物品不一致，也就是说测试集中存在部分物品，训练集中不存在，而协同过滤一个最大的特点就是对于训练集中不存在的物品是不可能作出预测的。

def data_split(dat

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

评分算法

评分算法_协同过滤推荐算法：评分预测准确性评估的相关文章

将摄像头输出的原始数据文件转换成bmp图像

引言从摄像头和传感器获得的视频数据是没有办法直接被电脑识别的所以需要进行转化我昨天在做项目的时候遇到了这个问题根据查阅相关资料实现了将摄像头输出的原始数据文件转换成bmp图像的程序语言 C C 测试平台 VC6 0 先把bmp
scikit-learn官方文档中文版

scikit learn sklearn 官方文档中文版简介
液态大脑与固态大脑——圣塔菲最新群体智能文集

来源 The Royal society 撰文 Ricard Sol Melanie Moses and Stephanie Forrest 大脑神经元构成的器官根植于许多生物体内这是一种固态的大脑且组成它们的元素在空间中相对固定但
QML VideoOutput 显示 YUV420P 数据流

查看VideoOutPut说明文档对source属性有以下说明 you can provide a QObject based class with a writable videoSurface property that can ac
Electron 收集崩溃日志

概述对于任何的客户端应用开发者都希望能够在用户上的手上记录下相关信息以便了解真实的使用情况一般情况下分为以下两种信息正常日志在不涉及隐私的情况下让开发者了解用户使用客户端的详细情况从这些情况中提炼的信息能够让开发者根据用户的
QT类学习系列（8）- QPushButton，QToolButton的区别

QPushButton与QToolButton的区别 weixin 42073232的博客 CSDN博客https blog csdn net weixin 42073232 article details 84848142 QToolBu
MyBatis框架（四）自定义映射

resultMap处理字段和属性的映射关系若字段名和实体类中的属性名不一致则可以通过resultMap设置自定义映射我们创建员工表如下所示我们创建的部门表如下所示多个员工对应一个部门是一个多对一的关系我们要把关系设置在多的地方
七夕节教你怎么选男朋友/女朋友~基于PaddleHub的身材打分系统

文章目录一项目背景 PaddleHub 介绍二效果展示三实现思路四具体步骤 1 安装 PaddleHub 到最新版本 2 新建目录 3 完成关键点检测 4 比例测算及打分 5 结果展示五总结与展望一项目背景各位小哥
计算机操作系统手册,轻松的开发一个操作系统(指导手册)

轻松的开发一个操作系统指导手册标签翻译家编程操作系统 chapter 1 前言我们都使用过操作系统又或者写过某个系统上运行着的程序但操作系统到底是来做什么的我所看到的工作多少是硬件完成的又有多少是软件完成的电脑实际上是如
adb no permissions问题

Google一番得知可以通过用root权限启动adb server来解决问题但是每次用adb不会很麻烦嘛后来发现在SDK的帮助文档里有关于这个问题的说明 If you re developing on Ubuntu Linux you
理解 $nextTick 的作用

有同学在看 Vue 官方文档时对 API 文档中的 Vue nextTick 和 vm nextTick 的作用不太理解其实如果看一下深入响应式原理 vue js中的有关内容可能会有所理解不过有些同学可能看到这个标题之后就选择跳过了
rsync同步脚本

bin bash export LANG C date date Y m d H M red echo e 033 0 31m blue echo e 033 0 36m white echo e 033 37m rsync usr bin
解决克隆虚拟机无法上网问题

通过VMware克隆出来一台linux的虚拟机但是发现没有办法上网然后上网查原来是在linux中有唯一标识网卡的UUID 我们是通过克隆过来的那么他们的UUID MAC地址和IP地址都相同了所以导致克隆出来的机子没有办法上网下面
access对比数据_数据分析师有理由爱Sqlserver之四-七大数据库测评Sqlserver胜出

虽说各家数据库产品大同小易学会一家其他家都可以很快上手但和编程语言的选择一样人的精力有限下只能深入研究一家的产品故在学习之前认真去评估应该选择哪一家数据库学习这样的时间也很值得总比学到一半不断地更换不同产品所浪费的时间好得
一类学习（OCSVM）

20201102 0 引言我记得我第一次接触一类学习的时候是在一本讲解异常流量的书上大概18年的时候当时有一个需求就是所处的场景下只能拥有一类数据而其他类的数据要不获取不到要不获取了也不具备什么代表性总体上就是这么一个场
VTK和Cmake的安装并运行一个vtk的案例

VTK的安装并运行一个项目 1 CMAKE安装要安装VTK的话首先需要安装CMAKE CMAKE的官网 https cmake org download 进入Cmake下载网页可以看到很多版本我们选择最新的在文件列表中我们选择最便
Java之类与对象

作者简介 zoro 1 目前大一正在学习Java 数据结构等作者主页 zoro 1的主页欢迎大家点赞收藏加关注哦目录初始面向对象什么是面向对象面向对象和面向过程区别类的定义和使用什么是类类的定义类的实例化什么是类
关于绘图的卡顿解决方案

在Android应用中 cocos的渲染和js的逻辑是在gl线程中进行的而android本身的UI更新是在app的UI线程进行的所以如果我们在js中调用的Java方法有任何刷新UI的操作都需要在UI线程进行如果画板的控件继承于Vie

随机推荐

Redis6+PHP:实现根据经纬度计算出附近门店距离

一开始介绍 Redis GEO 1 Redis GEO 主要用于存储地理位置信息并对存储的信息进行操作该功能在 Redis 3 2 版本新增 Redis GEO 操作方法 geoadd 添加地理位置的坐标 geopos 获取地理位置的
CloudCompare——泊松重建

目录 1 简介 2 利用输出密度 3 相关代码博客长期更新本文最近更新时间为 2023年8月10日 1 简介算法原理见泊松重建算法原理介绍 qPoissonRecon是 Poisson Surface Reconstruction
单片机原理概念

参考单片机原理概念作者爱学习的小王呀发布时间 2020 11 27 08 58 08 网址 https blog csdn net hongliwong article details 110219821 spm 1001 2014
SCL教程之如何使用SCL创建简单控制程序

最近有不少朋友都对SCL编程感兴趣网上的相关资料又较少今天我就为大家简单介绍一下如何使用SCL创建简单程序 1 首先我要先说明一下使用STEP7 或 PCS7都可以进行SCL编程其编程方式与TIA的编程方式类似但是语法稍有不同今天我
vue+a-form 动态表格,动态增加动态删除

思路借鉴了一位大佬的文章原文地址如下版权声明本文为qq 42203909原创文章遵循 CC 4 0 BY SA 版权协议转载请附上原文出处链接和本声明本文链接 antd实现动态增减表单项支持赋初始值首先是封装子组件自己起个
ios 启动执行初始化

UIViewController 分为下面三种情形创建依次调用的方法顺序如下 1 StoryBoard 1 initWithCoder 2 awakeFromNib 3 loadView 4 viewDidLoad 2 Xib 1 in
模型保存的两种类型torch.save

torch save model model face pt 一个常见的PyTorch函数是使用 pt文件扩展名来保存张量 model是我训练后的模型后面的参数 model face pt 就是我模型保存的类名存放同一文件夹下当然可以
数据库系统教程(第二版何玉洁)课后数据库上机实验答案

附录C 上机实验 C 1 第4章上机实验陈宇超仅供参考下列实验均使用SQL Server 的SSMS工具实现 1 用图形化方法创建符合如下条件的数据库创建数据库的方法可参见本书附录A l 数据库名为学生数据库 l 主要数据文件的逻
常用的java虚拟机参数_Java虚拟机参数分析 - PerfMa

参数查询支持查询一到多个 JVM 参数向用户展示每个 JVM 参数的详细信息包括含义用法等并可查看社区对此参数的相关讨论支持两种输入格式直接输入一个或多个参数名示例 Xms Xmx Xmn Xss MaxPermSize M
超详细的OpenCV入门教程，12小时带你吃透OpenCV。

OpenCV简介 OpenCV是一个基于Apache2 0许可开源发行的跨平台计算机视觉和机器学习软件库可以运行在linux Windows Android和MAC OS操作系统上 1 它轻量级而且高效由一系列 C 函数和少量 C
vue中scoped与/deep/深度选择器原理总结

最近在写一个vue element ui项目使用element ui某些组件修改样式时老是需要加上 deep 深度选择器以前只是知道这样用但是还不清楚他的原理这次就来好好的梳理一下 1 首先我们需要知道css中的属性选择器 w3c
Introduction to Causal Inference：Chapter 1因果推断概论

本文是学习brady neal于2020年开设的因果推断课程Introduction to Causal Inference的记录概述本chapter主要分四个部分辛普森悖论为什么相关性不是因果关系什么展示了因果关系在观测性研究
七、PyQt5实现Python界面设计_滑块控件（QSlider）与计数器控件（QSpinBox）

目录一 QSlider滑块控件 1 简介 2 常用函数 3 代码演示二 QSpinBox计数器控件 1 简介 2 常用函数 3 代码演示一 QSlider滑块控件 1 简介 1 水平或者垂直的滑动控件一般用来设置数字快速滑动来调整
「第二篇」全国一等奖，经验帖。

点击上方大鱼机器人选择置顶星标公众号福利干货第一时间送达阅读文本大概需要 6 分钟 0 前言本文作者谢斌曾经获得2017年控制题板球控制系统全国一等奖他之前有写过几篇关于比赛的文章大家可以点击阅读全国一等奖他
如何使用html制作网页

如何使用html制作网页一 html简介 1 1概念 HTML即HyperText Mark up Language 意思是超文本标记语言 HTML不是一种编程语言而是一种标记语言超文本指的是超链接标记指的是标签是一种用来制作网页
如何保护单例不被反射修改?

public class Safety private static Safety instance new Safety private Safety if instance null throw new RuntimeException
hadoop生态系统的详细介绍-详细一点

前提日常喜欢看一些微信分享的好文总结下来可以作为过滤器吧节约更多人的时间在这里引用的是别人的文章对原文的作者表示感谢确实写的很好 hadoop生态系统的详细介绍简介 Hadoop是一个开发和运行处理大规模数据的软件平台是A
Kafka By the sea——kafka的使用场景

文章目录消息队列概述消息队列应用场景异步处理应用解耦流量削锋日志处理消息通讯消息中间件示例电商系统日志收集系统常用消息队列 ActiveMQ Kafka 消息队列概述消息队列中间件是分布式系统中重要的组件主要解决应
js怎么做延迟函数delay

const delay ms gt new Promise resolve reject gt setTimeout resolve ms const getData status gt new Promise resolve reject
评分算法_协同过滤推荐算法：评分预测准确性评估

纸上得来终觉浅绝知此事要躬行宋陆游冬夜读书示子聿对于评分预测常用的准确性评测指标是均方根误差RMSE和平均绝对误差MAE RMSE 均方根误差对大的偏差更敏感 MAE 平均绝对值误差注意 R 表示数据集合的长度准确性指标计算

评分算法_协同过滤推荐算法：评分预测准确性评估

评分算法_协同过滤推荐算法：评分预测准确性评估 的相关文章

随机推荐

热门标签

评分算法_协同过滤推荐算法：评分预测准确性评估的相关文章