User Based CF 或 Item Based CF 需要多少数据才能提供推荐?

2023-12-30

User CF、Item CF需要多少数据才能给出推荐?

我手动创建了一个小数据集,因此我可以很好地理解该算法是如何工作的。
我发现对于我创建的小数据集,Slope-One可以给出推荐,User CF或Item CF不能给出推荐。

其背后的原因是什么?
数据量的阈值是多少?


在基于用户和项目的 CF 中,数据集的大小可能非常小。重要的部分是数据集中项目和用户之间映射的频率。如果用户仅在数据集中存在一次,则基于用户的 cf 很可能不会给出推荐。因为一个共同的项目不会提供两个用户成为邻居的相似度阈值。 上述解释只是一个示例案例。对于像 1000 个数据这样的小数据集,两个推荐器都会给出最相似的项目的答案并推荐方法。然而,对于较小的数据集,手动控制数据是否有足够的有关查询的用户/项目 ID 的信息是有用的。 在this http://blog.jteam.nl/2009/12/09/mahout-taste-part-one-introduction/链接您可以找到一个非常小的受控数据集来创建基于项目的 CF 及其工作原理。我希望这个答案有帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

User Based CF 或 Item Based CF 需要多少数据才能提供推荐? 的相关文章

随机推荐

  • 使用 XMLHttpRequest 获取非 utf8 数据

    我想从网上获取文档xmlHttpRequest 然而 有问题的文本不是 utf8 在本例中它是 windows 1251 但在一般情况下 我不确定 但是 如果我使用responseType text 它将字符串视为 utf8 忽略内容类型中
  • 如何覆盖 iOS 的 Xamarin Forms TabbedPage 项目字体?

    想要为我的 Xamarin Forms 应用程序实现一致的外观 我需要知道如何更改选项卡式页面选项卡栏图标的字体 使用UITabBarItem Appearance正如 iOS API 所建议的那样 似乎没有任何效果 这样做需要什么 您需要
  • 如何在flask中使用ajax调用上传文件

    你好 我对 Flask 很陌生 我想使用 ajax 调用来上传文件到服务器 正如文档中提到的 我将文件上传添加到 html 中 如下所示
  • List 中的最大项目是多少?

    有人知道列表中的最大项目数是多少吗 我如何增加这个大小 或者是否有一个可以容纳无限物品的集合 也就是说 尽可能多地容纳在内存中 EDIT 当整数列表中的 Count 134217728 时 出现内存不足异常 拥有 3Gb RAM 其中 2
  • Azure函数是否可以侦听多个blob以进行blob触发器

    我需要创建单个 azure 函数来侦听多个 blob 容器 是否可以 不 每个 Azure Functions 都有正好一个扳机 然而 有is替代 您可以在通用方法中实现 blob 的处理 定义多个函数并让它们全部调用通用方法 类似于 伪代
  • JSONP 使用安全吗?

    使用 JSONP 时有什么安全问题需要考虑吗 Update JSONP 是执行跨域请求的常见 hack 现代浏览器现在具有跨源资源共享功能 IE8 具有类似的 XDomainRequest 看http enable cors org htt
  • 使用 Docker Ask 的 Yahoo 管理器错误在 [ActorSelection[Anchor(akka://kafka-manager-system/) 上超时,

    为了复制此问题运行docker run zookeeper then docker compose up在下面yaml file 我正在使用 Zookeeper 最新图像 wurstmeister kafka 0 9 0 0 1 和Shee
  • XHTML 1.0 Strict 中的自定义数据

    我在 html 中使用一些自定义属性来处理 jquery 的内容 我看到有data XYZHTML5 中的属性 但我需要严格遵守 xhtml 1 0 我还有什么其他选择 您可以使用jQuery 元数据插件 https github com
  • 为什么 ia32/x64 操作码将文档 0x66 和 0xF2 映射为操作码 0x0F38F1 (CRC32) 的双重强制前缀?

    在 Intel 64 和 IA 32 架构软件开发人员手册中 表 A 4 附录 A 3 第 2C 卷 订单号 326018 045US 2013 年 1 月 的 F 行是唯一的 因为它有一个前缀子行 用于组合两个前缀 0x66 和 0xF2
  • Selenium RC:“等待窗口'null'本地帧'null'”

    我在这里完全不知所措 试图运行一个最小的 Selenium RC 风格测试 网上很多用户都描述了我遇到的问题 但没有一个widely不同的解决方案解决了我的问题 发生的情况是 Firefox 将打开 但在我看来是一个空的配置文件 因为它打开
  • 如何跟踪 Mac OS X 上的文件位置?

    很好的功能之一BBEdit http en wikipedia org wiki BBEdit这就是它跟踪文件的方式 无论这些文件发生什么情况 我正在开发的应用程序需要跟踪用户拥有的许多文件的位置 用户可以移动或删除这些文件 即使位置发生更
  • 检测按键是否被按下一次

    I wanted to do an action as soon as my f key is pressed The problem is that it spams the action import win32api while Tr
  • 如何在 PHPmyadmin 中禁用单元格单击上的内联编辑

    在 phpmyadmin 中 当我浏览表格内容时 单击某个单元格将启动此单元格数据编辑器 如何避免这种情况 我没有找到任何配置选项 从 phpMyAdmin 4 0 0 开始 double click现在是单元格编辑的新默认值 如果需要 您
  • 使类泛型有什么意义?

    当你有一个方法时 我知道将其声明为泛型是有意义的 这样我就可以采用泛型参数 像这样 public
  • Ubuntu 12.04 R install.packages() 不起作用。没有警告,不安装

    我正在运行 ubuntu 12 04 实例 并加载了 R3 0 2 但无法使用 install packages 来安装软件包 它下载了文件 但似乎没有安装它们 我在这里错过了什么吗 我在运行 ubuntu R 实例之前从未遇到过这个问题
  • go语言中的Unix域套接字名称

    The netgo中的包提供了这个功能 func ResolveUnixAddr net addr string UnixAddr error 字符串参数net给出网络名称 unix unixgram 或 unixpacket 我猜网络名称
  • 使用gradle将features.xml部署到nexus?

    我正在尝试创建一个 gradle 构建文件以将 features xml 文件部署到本地 Nexus maven 存储库中 除了直接使用 maven 之外 我还没有找到任何关于如何执行此操作的示例 有人有如何使用 gradle 执行此操作的
  • Python 类型:类型化字典或 defaultdict 扩展类

    我有一段旧的 python 代码 可以解析格式严格的文本文件 存储用于本地化的字符串 由于结构是分层的 并且某些元素可能存在也可能不存在 因此程序使用嵌套defaultdicts 来表示它 就像是 terms defaultdict lam
  • Rails 为所有命令行方法(例如生成或 rake)提供 NameError

    我是 Rails 的初学者 过去几天我一直试图找出这里到底出了什么问题 但完全没有运气 我到处寻找 但一无所获 基本上 当我运行任何类型的命令行方法时 我都会收到 NameError 我也尝试过在不同的项目目录中运行它 并且曾经有效 看来铁
  • User Based CF 或 Item Based CF 需要多少数据才能提供推荐?

    User CF Item CF需要多少数据才能给出推荐 我手动创建了一个小数据集 因此我可以很好地理解该算法是如何工作的 我发现对于我创建的小数据集 Slope One可以给出推荐 User CF或Item CF不能给出推荐 其背后的原因是