用户身份链接方法——DeepLink

2023-05-16

论文:DeepLink: A Deep Learning Approach for User Identity Linkage
在这里插入图片描述

**UIL(User Identity Linkage):**用户身份链接,通过方法发现跨社交平台上同一用户或者实体。即跨社交平台的同对象识别,UIL在用户行为预测、身份识别和隐私保护方面有很大的作用。

摘要

目前为了处理用户身份链接采用了依赖多社交平台相关特征提取的基于用户介绍(画像)、用户内容生成和用户行为的学习框架。其中的问题是,这些特征基于先验知识,在不同的平台和应用间有很大的不同。因此,论文中作者采用了深度神经网络来对UIL进行自动特征提取与表示,也就是DeepLink。DeepLink通过对网络采样将网络节点用向量表示,以便更好得获取网络的局部和全局结构。这些结构反过来又可以通过深度神经网络对锚点进行对齐(注意,完全对齐的网络在现实世界中几乎不存在,因此,我们利用部分对齐的锚节点(标记数据)来映射两个sng的用户潜在空间。)。利用二元学习范式,利用梯度学习知识转移和关联更新。

关键词:user identity linkage, social networks, deep learning, reinforcement learning

DeepLink需要获得的什么?

在这里插入图片描述
DeepLink需要获得这个函数φ_u,然而由于每个社交网络网络图(SNG)对于其他SNG来说是未知的,这个映射函数很难获得,因此,在大多数UIL实现中采用Graph Mapping Function近似φ_u。
在这里插入图片描述

UIL问题分类

基于特征的方法:利用领域知识和用户活动深度理解下人工特征工程。
基于网络的方法:利用网络结构描述跨社交平台的用户关联,最近引起广泛关注和研究。

当前方法的局限性

  • 没有提供一个全面的框架来解决用户和不同社交网络平台(这些平台是独立的)的异质性问题。
  • 用户表示:基于网络结构捕获用户之间潜在的语义关系是很困难的,很多现存的工作关注基于迁移学习的交叉平台的行为预测和关联。
  • 缺少带标签数据:跨平台获取一组具有相同身份的用户并不容易。

算法概述

①使用随机游走策略生成结点序列样本构造语料库。
②在初始化步骤中,在低维潜在空间中嵌入和表示每一个结点,并且使用锚点从G→G′预训练两个映射函数。
③使用基于策略梯度的方法以监督的方式(使用已知的对齐方式)学习基于对齐的锚节点对的跨网络节点对齐。

DeepLink的贡献

  • DeepLink利用深度神经网络,以端到端方式学习用户活动和网络结构的潜在语义,从而避免了劳动密集型的特征工程,也易于推广到各种OSNs中。
  • DeepLink利用半监督图正则化来预测网络中节点的上下文(邻近结构)。对锚节点的结构信息进行编码,实现网络的对齐。
  • DeepLink使用对偶学习过程来改善身份链接性能,并改进了监督训练算法。这样不仅可以利用未标记的锚节点,而且可以通过强化学习过程改进多网络间的映射。此外,所需的对齐(标记)锚节点的数量可以显著减少。
  • 为了证明DeepLink的有效性,作者对真实数据集和合成数据集进行了实验。结果表明,与最先进的方法相比,DeepLink可以显著提高身份识别的精度,例如,在链接精度方面,top-1可以达到30%,top-5可以达到40%。

算法细节

DeepLink组成

在这里插入图片描述
Network Sampling: 通过网络抽样形成“语料”以最大程度地保持网络结构:为了效率,此处采用简单的随机游走策略来探测网络结构生成社交序列。
Users Latent Space Embedding: 采用网络嵌入(Embedding)把网络里面的每一个节点表示为低维空间的一个向量:使用Skip-gram模型来更新社交表示(最大化对数似然估计)。
Unsupervised Automapping: 把锚点向量输入深度神经网络来训练出一个跨网络用户对齐(user alignment)的非线性转换:获取了每个社交网络潜在的嵌入空间后,DeepLink使用两个多层感知机(MLP)去学习任意两个基于锚点的社交网络中的映射函数。
Supervised Linkage Dual Learning: 使用对偶式学习过程改进UIL性能且提升有监督训练算法。
在这里插入图片描述
参考:www.shujuren.org/article/780.html

更多内容访问 omegaxyz.com
网站所有代码采用Apache 2.0授权
网站文章采用知识共享许可协议BY-NC-SA4.0授权
© 2020 • OmegaXYZ-版权所有 转载请注明出处

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用户身份链接方法——DeepLink 的相关文章

随机推荐

  • celery启动报错:kombu.exceptions.VersionMismatch: Redis transport requires redis-py versions 3.2.0

    问题原因 xff1a kombu依赖包从v4 3 0开始对redis py v2 10 6不兼容 所以需要使用旧版本的kombu 解决方法 xff1a pip install kombu 61 61 4 2 0 此时重启celery即可正常
  • SSH与GIT操作时出现Host key verification failed

    问题描述 在进行首次SSH链接与GIT操作时出现以下报错 xff1a 解决方法 vim etc ssh ssh config 在文档的末尾添上 StrictHostKeyChecking no UserKnownHostsFile dev
  • Cordova 打包 Android release app 过程详解

    转自 xff1a http www tuicool com articles 673mE3m Android app 的打包分为 debug 和 release 两种 xff0c 后者是用来发布到应用商店的版本 这篇文章会告诉你 Cordo
  • 人生苦短,我用Manjaro || 愿你Manjaro半天,归来仍是Deepin

    前言 先秀一下桌面 xff08 爱哟 xff0c 木兰姐姐真好看呀 xff09 Manjaro总体上装起来是挺方便的 但是对于双显卡的本子的确是真的不友好 本教主希望来总结一下装这个manajro gnome的艰辛历程 xff0c 以及双显
  • C# Winform调用MATLAB 动态链接库运算后窗体发生改变

    C Winform调用MATLAB 动态链接库运算后窗体发生改变 问题描述 xff1a 开始启动时 大小为最开始设置的大小 xff0c 当调用MATLAB 动态链接库时 xff0c 窗口突然变小 解决方案 在网上查询主要说两种方法 xff1
  • 在柱状图中找最大矩形——O(n)时间复杂度java实现

    最近在刷leetcode xff0c 又碰到了这道题 xff0c 想起来当时算法有些瑕疵 xff0c 所以将最新的AC代码更新在最上面做个对比 xff0c 具体思路见注释 public class Solution 思路 主要是使用一个栈来
  • 组合模式与职责链模式编程实现

    组合模式 简介 将对象组合成树形结构以表示 部分 整体 的层次结构 组合模式使得用户对单个对象和组合对象的使用具有一致性 动机 总部 分部和办事处是成树状结构 xff0c 也就是有组织结构的 xff0c 不可以简单的平行管理 希望总公司的组
  • 动态规划-最大的正方形面积

    题目表述 Given a 2D binary matrix filled with 0 s and 1 s find the largest square containing only 1 s and return its area Fo
  • 迭代器模式C++实现

    简介 提供一种方法顺序访问一个聚合对象中各个元素 xff0c 而又不暴露该对象的内部表示 动机 一个聚合对象 xff0c 如列表 xff08 List xff09 应提供一种方法来让别人可以访问它的元素 xff0c 而又不需要暴露它的内部结
  • macOS Catalina常见问题汇总

    本文共535个字 xff0c 预计阅读时间需要2分钟 作为一个伪程序员 xff0c 我来说说macOS Catalina的一些软件兼容性和注意点 macOS Catalina 正式版无法使用的APP 有道词典闪退 brew版本过低的加载错误
  • Failed to import pydot. You must install pydot and graphviz for `pydotprint` to work.

    Graphviz的可执行文件 http www graphviz org Download windows PHP 参考 xff1a http blog csdn net u014749291 article details 5489108
  • 计算机保研-中科院计算所霸面(笔试面试)

    基本情况 xff1a 学校 xff1a 末流211 排名 xff1a 1 70 绩点 xff1a 4 33 5 0 竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xff09 科研 xff1a 一篇水
  • 计算机保研-中科大计算机

    Abstract 2019年中科大计算机夏令营比往年增加了不少难度 xff0c 统一增加了机试环节 xff0c 面试难度提高 xff08 陈恩红实验室和李向阳实验室向来包含机试 xff09 xff0c 最终录取率在60 左右 xff08 往
  • NSGA-II资料合集

    关于NSGA II的一些资料 NSGA II中文翻译 MATLAB代码 NSGA II的解释 简介 关于演化计算 生物系统中 xff0c 进化被认为是一种成功的自适应方法 xff0c 具有很好的健壮性 基本思想 xff1a 达尔文进化论是一
  • 简单区块链Python实现

    什么是区块链 区块链是一种数据结构 xff0c 也是一个分布式数据库 从技术上来看 xff1a 区块是一种记录交易的数据结构 xff0c 反映了一笔交易的资金流向 系统中已经达成的交易的区块连接在一起形成了一条主链 xff0c 所有参与计算
  • 复旦大学计算机保研夏令营

    Abstract 复旦的夏令营 xff1a 自由而无用 xff0c 一期招了200人入营 xff0c 不提供住宿 xff08 导致我租了个旅馆每天要骑单车来学校 xff0c 不过沿途环境不错 xff0c 有很多吃的地方 xff09 xff0
  • 计算机保研夏令营预推免

    夏令营与预推免个人情况 学校 xff1a 末流211 xff08 安徽大学 xff09 排名 xff1a 1 70绩点 xff1a 4 33 5 0竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xf
  • 知识图谱嵌入的应用场景

    In KG应用 xff08 在 KG 范围内的应用 xff09 链接预测 xff08 Link prediction xff09 链接预测任务有时也称为实体预测或实体排序 xff0c 用来预测两个实体之间是否有特定的关系 即已知头实体h和关
  • Neo4j数据导入与可视化

    本文共1262个字 xff0c 预计阅读时间需要5分钟 简介 Neo4j是一个高性能的NoSQL图形数据库 xff0c 它将结构化数据存储在网络上而不是表中 它是一个嵌入式的 基于磁盘的 具备完全的事务特性的Java持久化引擎 xff0c
  • 用户身份链接方法——DeepLink

    论文 xff1a DeepLink A Deep Learning Approach for User Identity Linkage UIL xff08 User Identity Linkage xff09 xff1a 用户身份链接