非负矩阵分解中的评分预测

2024-04-11

我正在关注这个博客http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/ http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/（此处还附加了矩阵）用于使用矩阵分解进行评分预测。最初我们有一个稀疏的用户电影矩阵 R 。

然后，我们应用 MF 算法来创建一个新矩阵 R'，它是 2 个矩阵 P(UxK) 和 Q(DxK) 的乘积。然后我们“最小化” R 和 R' 中给出的值的误差。到目前为止一切顺利。但在最后一步，当矩阵填满时，我不太确信这些是用户将给出的预测值。这是最终的矩阵：

证明这些实际上是“预测”收视率的依据是什么？另外，我计划使用 P 矩阵（UxK）作为用户的潜在特征。我们能否以某种方式“证明”这些实际上是用户的潜在特征？

使用每个用户获得的向量作为潜在特征向量的理由是，使用这些潜在特征值将minimize预测评级与实际已知评级之间的误差。

如果您查看您发布的两个图表中的预测评分和已知评分，您会发现两个矩阵中共同的单元格之间的差异非常小。示例：U1D4 在第一个图中为 1，在第二个图中为 0.98。

由于特征或用户潜在特征向量在已知评级上产生了良好的结果，我们认为它在预测未知评级方面会做得很好。当然，我们使用正则化来避免过度拟合训练数据，但这是总体思路。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

非负矩阵分解中的评分预测的相关文章

Wor2vec 微调

我需要微调我的 word2vec 模型我有两个数据集 data1 and data2 到目前为止我所做的是 model gensim models Word2Vec data1 size size v window size w min
如何从 pandas 数据框中提取日期/年/月？

我正在尝试从 pandas 数据框中的日期列中提取年日期月信息这是我的示例代码 from datetime import datetime def date split calendar for row in calendar n
获取 GridSearchCV 的标准差

在 scikit learn 0 20 之前我们可以使用result grid scores result best index 以获得标准差它返回例如 mean 0 76172 std 0 05225 params n neighbor
如何创建导入最常用的 python 模块的快捷方式？

我正在寻找一种方法来自动或作为快捷方式在 jupyter 笔记本中导入一组 python 模块这样我就不必每次创建新笔记本时都导入它们我发现将这些模块导入到每个笔记本中非常重复我在这里能想到的最接近的事情是创建一个 python
提取 YouTube 频道社区源数据

我正在尝试从分析渠道收集社区源数据我找不到使用 YouTube Data API v3 的方法有没有办法提取此类数据 The data I would like to extract is in the community feed F
如何根据平均值、中位数、第 1 和第 9 十分位数值生成数据集？

我有以下描述数据集的值 Number of Samples 5388 Mean 4173 Median 4072 1st Decile 2720 9th Decile 5676 我需要生成适合这些值的任何数据集我发现的所有例子都要求你有标
如何以及何时在 Python Pandas 中使用链索引？

我正在学习数据科学course关于 Python 中的数据分析在课程中的某个时刻教授说您可以将操作链接在一起例如我们可以重写查询所有 Store 1 的成本为 df loc Store 1 Cost 这看起来很合理并且得到了我
如何通过文件处理从给定的数据框列中获取唯一对？

sample data from dataframe Pairs 8 8 8 8 8 8 8 8 8 8 6 7 7 7 7 7 7 6 6 7 2 12 12 3 3 4 4 12 12 12 new col for e in conte
非常大且非常稀疏的非负矩阵分解

我有一个非常大且稀疏的矩阵 531K x 315K 单元格总数约为 1670 亿非零值仅为 1s 非零值总数约为 45K 有高效的 NMF 包来解决我的问题吗我知道有几个软件包可以实现这一点并且它们仅适用于小尺寸的数据矩阵任何想法都
使用 xarray 对非标准 CFTimeIndex 日历（360 天，无闰年）重新采样以供 pandas 使用的方法

60198708 https stackoverflow com questions 60198708 xarray cftimeindex to datetimeindex out of bounds nanosecond timesta
下载 Graphlab 依赖项 get_dependencies() 时出现问题

当我尝试下载运行所需的依赖项时遇到问题graphlab I do import graphlab我得到以下信息 ACTION REQUIRED Dependencies libstdc 6 dll and libgcc s seh 1 dl
Pandas 多索引数据框 - 从多索引中的一个索引中选择最大值

我有一个具有年和月多重索引的数据框如下所示 Value Year Month 1 3 1992 2 5 3 8 1993 1 2 我试图选择每年的最大值并将其放入 DF 中如下所示 Max Year 1992 5 1993 2 关于多索
可以在 Folium 中绘制路径吗？

我阅读了许多与此相关的文档但找不到我想要的东西我想绘制两点之间的步行路径是否可以如果没有 python 中是否有其他库用于此目的当然可以使用PolyLine https python visualization github i
类型错误：__init__() 得到意外的关键字参数“iid”

我使用以下方法找到了最佳参数和最佳分数网格搜索简历 and 随机搜索CV对于我的 TCSVM 模型现在我想用贝叶斯搜索CV为了与以前的方法进行比较但我得到了这个错误 init got an unexpected keyword argu
为什么 ml_create_dummy_variables 在 Sparklyr 中不显示新的虚拟变量列

我正在尝试在 Sparklyr 中创建模型矩阵有一个功能ml create dummy variables 用于一次为一个分类变量创建虚拟变量据我所知没有 model matrix 等效于一步创建模型矩阵很容易使用ml create
Python Pandas：如何将成对映射列表转换为行向量格式？

我有一个 2 列 DataFrame column 1 对应于客户 column 2 对应于该客户访问过的城市数据框如下所示 print df customer visited city 0 John London 1 Mary Melb
Pandas：将列与数据帧的所有其他列进行比较

我有一个场景我有新的受试者正在测试一系列特征其中结果都是字符串分类值测试完成后我需要将新数据集与所有受试者的主数据集进行比较并寻找给定阈值例如 90 的相似性匹配因此我需要能够以尽可能最佳的性能对新数据集中的每个新主题与主
scikit-learn - 将管道预测转换为原始值/规模

我创建了一个管道如下所示使用Keras Scikit Learn API https keras io scikit learn api estimators estimators append standardize Standard
SpaCy 模型“en_core_web_sm”的词汇量大小

我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词我也在同
如何获得线性回归的调整 R 平方

使用 sklearn metrics 我可以计算 R 平方如何使用线性回归模型计算调整后的 R 平方 Scikit Learn 的线性回归不会返回调整后的 R 平方但是您可以根据 R 平方通过以下公式计算调整后的 R 平方其中 p

随机推荐

构建 Java Swing GUI 的最佳方法？

到目前为止我一直在使用 Netbeans Swing GUI 生成功能为我的 java 应用程序构建 GUI 现在我已经开始在我的项目中使用 Eclipse 并放弃了 Netbeans 那么除了手动编写 GUI 的所有代码之外还有什么其
ios UICollectionView 单元格之间顶部/底部分离

我有一个集合视图工作正常并且我调整了 X 填充的分离而且效果很好但对于单元格之间的 Y 填充似乎没有调整为无分离这是我的布局代码 UICollectionViewFlowLayout layoutItem UICollectio
如何使用 slf4j 记录 postgres 驱动程序消息？

我在我的网络应用程序中使用 postgres db 我在我的中添加了以下依赖项pom xml
AS3 - 我可以知道一个类是否实现了一个接口（或者是另一个类的子类）？

有了这个代码 function someFunction classParam Class Boolean how to know if classParam implements some interface 即比较classParam
.NET 系统类型到 SqlDbType

我一直在寻找 Net System Type 和 SqlDbType 之间的智能转换我发现这是以下想法 private static SqlDbType TypeToSqlDbType Type t String name t Name
如何生成与 java TimeZone 对应的良好时区下拉列表

其他网络应用程序使用什么策略来生成格式良好的时区列表以满足用户偏好我尝试获取所有时区但列表很长而且格式不适合用户只是想知道其他人是如何做到这一点的下面的代码片段 String ids TimeZone getAvailableID
如何访问包含特殊字符的对象属性？

我有一个formDOM 元素 var virDom document getElementsByTagName form 0 virDom有两个带 ID 的字段creditId and pwdId 我可以访问virDom creditId没
表与临时表性能

对于数百万条记录哪个更快永久表or临时表我只需要将它用于 1500 万条记录处理完成后我们删除这些记录在您的情况下我们使用称为临时表的永久表这是大量导入的常用方法事实上我们通常使用两个暂存表一张包含原始数据一张包含清
如何获取用javascript加载的标签值

我有一个这样的链接它是从 Instagram api 获取的 http localhost 60785 access token aspx access token 43667613 4a1ee8c 791949d8f78b472d813
glBufferData() 的分段错误

我不明白为什么这段代码会出现段错误 AxesMarker AxesMarker float size size size vbo vertices 0 vbo elements 0 Vertex vertices 6 Vertex Colo
严格模式性能更高吗？

一般来说在浏览器中以严格模式执行 JavaScript 是否会提高性能主流浏览器是否会进行额外的优化或使用任何其他技术来提高严格模式下的性能稍微改一下除了其他目标之外严格模式是否旨在允许浏览器引入额外的优化或其他性能增强除其
cakephp - 获取表名称及其列详细信息

有谁知道如何从模型名称获取表名称另外我想获取该模型表名称的所有列名称及其类型是否有可能获得给定型号名称的此类详细信息 Thanks 表名要获取该表请参阅 this gt Model gt table 或者检查类变量的模型 useT
geocomplete 不是使用自动完成的函数

您好我正在使用自动填充代码收到错误 geocomplete 不是一个函数如果在本地单独的文件中使用它它对我有用可能是什么错误 function location geocomplete alert gine details g
如何知道 RecyclerView / LinearLayoutManager 是否滚动到顶部或底部？

目前我正在使用以下代码来检查是否应启用 SwipeRefreshLayout private void laySwipeToggle if mRecyclerView getChildCount 0 mRecyclerView getChi
无法连接到数据库来执行身份功能

我使用 ASP NET MVC5 创建了一个新应用程序使用个人用户帐户来确保安全性并使用代码优先迁移来进行模型数据库建模所有选项均为默认我想为其设置自定义用户和角色所以我使用创建了一个种子RoleManager and User
Mongodb findAndModify节点js

以下代码在 Node js 中给了我一个异常需要删除或更新 var args query id id update set data new true remove false db collection COLLECTION INVEN
如何使用 PHP 将 XPath 表达式作为 XSL 参数传递？

我有一个非常大的 XML 文件我要从中提取信息并将其转换为不同的 XML 格式我已经完美地运行了转换本身所以现在我想通过使用 PHP 传递变量来使其更加灵活select 标准以下是我正在使用的工作 XSLT 代码为简单起见进行
ansible 有 yaml 编辑模块吗？

我需要修改 yaml 文件施洛德配置 http schleuder2 nadir org documentation v2 2 index html 并且我想从 ansible 剧本中执行此操作是否有模块可以执行此操作很难用谷歌搜索这
scanf("%d", &value) 中的字符输入[重复]

这个问题在这里已经有答案了简而言之我的代码是 include
非负矩阵分解中的评分预测

我正在关注这个博客http www quuxlabs com blog 2010 09 matrix factorization a simple tutorial and implementation in python http www

非负矩阵分解中的评分预测

非负矩阵分解中的评分预测 的相关文章

随机推荐

热门标签

非负矩阵分解中的评分预测的相关文章