使用 Gremlin 在二部图上随机游走

2023-12-30

我想根据给定的用户偏好（用户喜欢的项目）基于使用groovy中的gremlin在有向二分图上进行随机游走来对项目进行排名。

该图具有以下基本结构：

[用户1] ---'喜欢'---> [项目A] [项目B]

此后我提出的查询：

def runRankQuery(def userVertex) {
    def m = [:]
    def c = 0
    while (c < 1000) {
        userVertex
            .out('likes')   // get all liked items of current or similar user
            .shuffle[0]     // select randomly one liked item
            .groupCount(m)  // update counts for selected item
            .in('likes')    // get all users who also liked item
            .shuffle[0]     // select randomly one user that liked item
            .loop(5){Math.random() < 0.5}   // follow liked edge of new user (feed new user in loop) 
                                            // OR abort query (restart from original user, outer loop)      
            .iterate()
        c++
    }
    m = m.sort {a, b -> b.value <=> a.value}
    println "intermediate result $m"
    m.keySet().removeAll(userVertex.out('likes').toList())
    // EDIT (makes no sense - remove): m.each{k,v -> m[k] = v / m.values().sum()}
    // EDIT (makes no sense - remove): m.sort {-it.value }
    return m.keySet() as List;
}

但是，此代码没有找到新项目（上面示例中的[ItemB]），但是only给定用户喜欢的项目（例如 [ItemS]）。

我需要更改什么才能为新用户（例如 [User2]）提供循环步骤返回到“out('likes')”步骤以便继续行走？
一旦此代码运行，是否可以将其视为“个性化 PageRank”的实现？

这里是运行示例的代码：

g = new TinkerGraph()

user1 = g.addVertex()
user1.name ='User1'
user2 = g.addVertex()
user2.name ='User2'
itemA = g.addVertex()
itemA.name ='ItemA'
itemB = g.addVertex()
itemB.name ='ItemB'

g.addEdge(user1, itemA, 'likes')
g.addEdge(user2, itemA, 'likes')
g.addEdge(user2, itemB, 'likes')

println runRankQuery(user1)

和输出：

intermediate result [v[2]:1000]
[]
==>null
gremlin> g.v(2).name
==>ItemA
gremlin>

我发现这是一个非常奇怪的问题。我发现了几个非常奇怪的问题，这些问题不容易解释，最后，我不确定为什么它们是这样的。对我来说最奇怪的两件事是：

不知道是不是有问题shuffle步。在您的情况下，它似乎没有正确随机化。我似乎无法在这种情况之外重现问题，所以我不确定它是否与您的数据大小或其他内容有关。
我在使用时遇到了奇怪的问题Math.random()打破循环。

不管怎样，我认为我已经通过我的更改捕获了您的代码的本质，这些更改似乎可以满足您的要求：

runRankQuery = { userVertex ->
    def m = [:]
    def c = 0
    def rand = new java.util.Random()
    while (c < 1000) {
        def max = rand.nextInt(10) + 1
        userVertex._().as('x')
            .out('likes')   
            .gather.transform{it[rand.nextInt(it.size())]}
            .groupCount(m) 
            .in('likes')    
            .gather.transform{it[rand.nextInt(it.size())]}
            .loop('x'){it.loops < max}  
            .iterate()
        c++
    }
    println "intermediate result $m"
    m.keySet().removeAll(userVertex.out('likes').toList())
    m.each{k,v -> m[k] = v / m.values().sum()}
    m.sort {-it.value }
    return m.keySet() as List;
}

我更换了shuffle使用我自己的“洗牌”品牌，从收集的列表中随机选择一个顶点。我也随机选了一个max循环而不是依赖Math.random()。当我现在运行这个时，我想我得到了您正在寻找的结果：

gremlin> runRankQuery(user1)                                       
intermediate result [v[2]:1787, v[3]:326]
==>v[3]
gremlin> runRankQuery(user1)
intermediate result [v[2]:1848, v[3]:330]
==>v[3]
gremlin> runRankQuery(user1)
intermediate result [v[2]:1899, v[3]:339]
==>v[3]
gremlin> runRankQuery(user1)
intermediate result [v[2]:1852, v[3]:360]
==>v[3]

你可能还会得到Math.random()在一些迭代中，它的表现对我来说是可预测的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Groovy

Gremlin

bipartite

graphtraversal

randomwalk

使用 Gremlin 在二部图上随机游走的相关文章

异步作业出错

我正在尝试创建一个不会阻止请求的异步任务用户发出请求任务将启动控制器将呈现作业正在运行这是为了避免请求被阻止等待任务完成任务完成后它将执行 onComplete 并对该任务的结果执行某些操作例如调用将向用户发送邮件的服务 E
Jenkinsfile：在 Docker 容器中运行 sh 步骤时权限被拒绝

我在运行简单的程序时遇到问题Jenkinsfile e g pipeline agent label ssh slave stages stage Shell Test steps sh echo Hello World master 上的
使用soapUI中的Groovy teststep将请求/响应文件存储在本地目录中

通过soapUI中的常规测试步骤我希望所有请求和响应文件都存储在具有系统日期的本地目录中 SoapUI 中的常规测试步骤 def name context expand Input TG def locatie context expan
如何在 android dexDebug 或 dexRelease 任务之后执行 gradle 任务

我想在 android 构建过程中在 dexRelease 或 dexDebug 任务之后运行 Gradle 任务来执行一些 shell 脚本我尝试过以下方法 task taskAfterDex type Exec workingDir
使用 Gremlin 查询语言获取边属性以及源和目标顶点 ID

我正在尝试检索边缘属性作为值以及目标和源节点 ID 我当前的数据库如下所示 Edge id label outV inV name ID 0 edge 0 1 E 0 Nodes id label name ID 0 node A 0 1
如何循环遍历列表并删除 groovy 中的项目？

我试图弄清楚如何从循环内的 groovy 列表中删除项目 static main args def list1 1 2 3 4 for num in list1 if num 2 list1 remove num println list1
如何在 Jenkins Freestyle 项目中使用可锁定资源插件中的 Groovy 表达式

这个问题是针对旧版本提出的可锁定资源插件 https wiki jenkins ci org display JENKINS Lockable Resources Plugin 旧版本中的错误自2 1版本以来已得到修复然而没有描述如何在
如何在 Intellij IDEA 实时模板 groovy 脚本中将变量传递给 groovy 代码？

我有一个groovyScript in my IntellijIDEA 实时模板如下所示 groovyScript D test groovy v1 on my D test groovy我有这样的代码 if v1 abc abc 现在我
groovy 中具有默认值的命名参数

是否可以在 groovy 中使用具有默认值的命名参数我的计划是创建一种对象工厂可以在没有任何参数的情况下调用它以获得具有默认值的对象另外我需要显式设置对象的任何参数的功能例如我相信这可以通过 Python 关键字参数实现我现
Groovy hasProperty/respondTo

All the examples http mrhaki blogspot com 2009 10 groovy goodness check if method or html我看到使用hasProperty or respondsTo显
使用 groovy 向 jenkins 作业添加附加参数

我们有一组 groovy 脚本用户可以在他们的 jenkins 文件中调用它们来设置一些常见的作业属性但是我们无法弄清楚在进行此更新时如何保留其现有参数我们的常规代码片段 def newParamsList def newbool
GPars 报告大量异步函数的状态并等待完成

我有一个解析器在收集一行数据后我想触发一个 aync 函数并让它处理该行同时主线程继续运行并获取下一行我看过这个帖子在 Groovy 中如何同时执行两个任务并等待结果 https stackoverflow com questio
如果 Jenkins 构建标记为“永远保留此构建”，请勿删除它 - 用于删除 Jenkins 构建的 Groovy 脚本

我有以下 Groovy 脚本它删除给定 Jenkins 作业的所有构建除了用户提供的一个构建号即想要保留 BEGIN META name Bulk Delete Builds except the given build number
带有 Spock Stub 的泛型

我无法为泛型类编译 Spock 存根构造函数的签名如下 SomeClass SerSup
遍历多行字符串

我得到一些数据 def data some useless text n even more n finally interesting text 我怎样才能得到其中有趣的部分所以基本上所有行都不是以开头的 Groovy 的一种选择是
groovy 无法解析 kotlin 类

由于我无法解决我遇到的问题kotlin 我决定回到groovy为了实现该插件但是我遇到了这个问题我有这样的项目结构为了不重写所有类我决定重用中实现的类kotlin 然而我的课FileProcessingCoreGroovy Down
可以混合使用 JVM 语言吗？即：Groovy 和 Clojure

我知道你可以轻松地混合groovy java clojure java 无论什么JvmLang java 这是否也意味着我也可以让 clojure 和 groovy 代码进行交互如果我使用 Grails 或 jRoR 我也可以在该环境中使
如何在gradle中复制文件？

我正在尝试将战争档案部署到 Tomcat 中这是我编写的构建脚本 apply plugin war task deploy dependsOn war copy from build libs into E apache tomcat 8
Groovy 和 Groovy++，它们有什么不同吗？

我最近知道groovy 已经发布了 Groovy和Groovy 的主要区别是什么来自 groovy 页面http code google com p groovypptest http code google com p groovypp
在 System Groovy 中暂时禁用 Jenkins 服务器上的 SCM 轮询

我们有一个 Jenkins 服务器正在运行 20 到 30 个作业由于构建过程相当复杂我们将实际构建分解为 1 个子构建其中一些可以同时运行其他则必须遵循之前的构建步骤因此我们将每个构建步骤分为 3 组这三组在构建进行时会被

随机推荐

如何在 TinyMCE v4 中实现tinymce.Shortcuts

我想向我的 TinyMCE 编辑器添加键盘快捷键这是我的初始化代码 tinymce init selector textarea menubar false mode exact plugins advlist autolink list
如何：Spring 摆脱 @Validate 以进行自动控制器验证？

我知道关于 Valid注释指示 spring 根据 JSR 303 验证控制器参数如下例所示 GetMapping test public TestDTO testDTO Valid TestDTO testDTO return test
从 XPath 字符串中删除或替换某些文本

是否可以删除或替换 XPath 字符串上的文本使用 XPath 我得到 urlhttp www http www我想删除http www http www 所以相同的 XPath 查询只会返回一个链接而不返回http www http
单个语句中的多个 mongodb 更新运算符？

我可以将 pushAll 和 inc 合并在一个语句中吗在合并之前这工作正常 db createCollection test db test insert name albert bugs db test update name al
Firefox 在使用溢出时忽略填充：滚动

使用时overflow scroll结合padding CSS 属性 Firefox 中缺少元素底部的填充但适用于 Chrome 和 Safari container height 100px padding 50px border so
如何查找 MongoDB Collection 中特定文档的大小？

我在 MongoDB 集合中有 100k 个文档 document id 789736363828292 有 20k 文档记录我想找到该特定文档使用的内存请帮我在 MongoDB 控制台中找到内存大小以 MB 为单位您可以使用Ob
如何在标题中获取黄瓜场景变量？

我希望能够通过使用标题本身中的示例让我的场景大纲标题包含更多信息 Scenario Outline A
如何使面板居中？

即使表单的大小发生变化如何使面板居于表单中心使用 C Windows 应用程序使用设计器将面板放置在窗体的中心然后清除Anchor属性因此它不锚定到任何边缘这将在调整表单大小时使其保持居中而无需调整面板本身的大小如果由于某种
图搜索和树搜索有什么区别？

有什么区别图搜索 and 树搜索有关 DFS A 搜索的版本人工智能从现有的答案来看这个概念似乎存在很多混乱问题始终是图表树搜索和图搜索之间的区别并不在于问题图是树还是一般图始终假设您正在处理一般图表区别在于遍历模式用于搜索图形
Google 地图 API v3 - 灰显或删除状态？

是否可以将我不想从地图上看到的状态灰显甚至更好地一起删除搜索时无法找到任何明确的答案我试图仅显示德克萨斯州地图并在其上放置标记 Thanks 你在寻找类似的东西吗这个 v2 示例 http maps forum nu gm texas
MSChart：饼图标签重叠问题

我用过MSChart Control在我的一个VB NET项目我决定将如下表所示的数据显示为饼图但标签相互重叠为了摆脱它我已经尝试过智能标签属性如下图所示 Chart1 Series Default SmartLabelStyl
如何防止标签栏控制器中的视图控制器旋转？

我有一个管理 4 个选项卡的选项卡栏控制器我对选项卡栏控制器进行了子类化以便 shouldAutorotateToInterfaceOrientation 方法仅允许选项卡之一中的特定视图控制器旋转一切工作几乎正常其余选项卡中的控制
Oracle 数据库：DBMS_ALERT 在 Java 应用程序中的使用

我有一个 java 应用程序服务器使用 JDBC 与 oracle 11 2 数据库服务器进行通信客户端的请求被发送到应用程序服务器该应用程序服务器运行调用数据库中的第一个存储过程的java方法我希望 java 方法在调用存储过程后
Python中线程之间的通信（不使用全局变量）

假设我们有一个主线程它为测试模块启动两个线程 test a 和 test b 无论测试模块执行完毕还是遇到任何错误警告或者想要更新某些其他信息两个测试模块线程都会保持其状态主线程如何访问这些信息并采取相应的行动例如如果 test
在R中获取Windows系统文件夹（用户主目录，“我的文档”等）路径

我想获取用户主文件夹的完整路径通常类似于 C Users USERNAME 或我的文档文件夹但无法找到从 R 脚本执行此操作的方法有什么解决办法吗我想你想要 path expand
C# WPF 应用程序 .NET 4.5 设置鼠标位置 [重复]

这个问题在这里已经有答案了第一次在这里问问题我在这里找到的解决方案似乎由于某种原因不起作用我的应用程序需要在窗口激活时设置鼠标位置我设置了该功能但无法使光标属性发挥作用由于某种原因我无法使用 Cursor Position 或
使用 SSH.NET 连接到 OpenSSH 7.4p1 失败，并显示“服务器响应在该位置包含空字符”，但在 WinSCP 中可以正常工作

我正在尝试使用 SSH NET 2020 0 0 连接到 SFTP 服务器我的代码看起来很简单 try var x new ConnectionInfo FtpIpAddress 22 FtpUser new PasswordAuthen
Scala 复制具有泛型类型的案例类

我有两节课PixelObject ImageRefObject还有更多但这里只是这两个类来简化事情它们都是a的子类trait Object包含一个 uid 我需要通用方法它将使用给定的新实例复制案例类实例uid 我需要它的原因是因为我
使用 DotNetNuke 设置单独的 ASP.NET 应用程序

我在 Windows Server 2008 64 位系统上安装了 DotNetNuke v5 1 4 社区版使用 SQL Server 2008 64 位作为后端数据库并且我想从中引用一个单独的 ASP NET 应用程序我计划通过
使用 Gremlin 在二部图上随机游走

我想根据给定的用户偏好用户喜欢的项目基于使用groovy中的gremlin在有向二分图上进行随机游走来对项目进行排名该图具有以下基本结构用户1 喜欢 gt 项目A 项目B 此后我提出的查询 def runRankQuery def

使用 Gremlin 在二部图上随机游走

使用 Gremlin 在二部图上随机游走 的相关文章

随机推荐

热门标签

使用 Gremlin 在二部图上随机游走的相关文章