【推荐算法】双塔模型代码（tensorflow）

2023-11-20

上文介绍了双塔模型的原理和结构，这篇介绍一下双塔模型的代码实现。我使用的是tensorflow来实现双塔模型和模型训练。

一、前期准备

tensorflow使用的版本是2.0.0
数据格式（如果需要获取数据，可以见下方链接）：

不过由于是Demo，我只用了部分字段进行训练。

二、详细代码

DSSM模型代码

import tensorflow as tf

def dssm_model(feature_inputs, item_feature_columns, user_feature_columns, hidden_units):
    item_tower = tf.keras.layers.DenseFeatures(item_feature_columns)(feature_inputs)
    for num_nodes in hidden_units:
        item_tower = tf.keras.layers.Dense(num_nodes, activation='relu')(item_tower)

    user_tower = tf.keras.layers.DenseFeatures(user_feature_columns)(feature_inputs)
    for num_nodes in hidden_units:
        user_tower = tf.keras.layers.Dense(num_nodes, activation='relu')(user_tower)

    output = tf.keras.layers.Dot(axes=1)([item_tower, user_tower])
    output = tf.keras.layers.Dense(1, activation='sigmoid')(output)

    model = tf.keras.Model(feature_inputs, output)
    return model

模型训练、预测与保存代码

def gen_dataset(data_df: pd.DataFrame, columns: dict):
    data_dict = dict()

    def _get_type(type_str):
        if type_str == "int32":
            return np.int32
        elif type_str == "float32":
            return np.float32
        elif type_str == "string" or type_str == "str":
            return np.str
        else:
            return np.int32

    for key in columns.keys():
        data_dict[key] = np.array(data_df[key]).astype(_get_type(columns[key]))

    return data_dict


def parse_argvs():
    parser = argparse.ArgumentParser(description='[DSSM]')
    parser.add_argument("--data_path", type=str, default='./data/')
    parser.add_argument("--model_path", type=str, default='./model_param')
    parser.add_argument("--epoch", type=int, default=10)
    parser.add_argument("--monitor", type=str, default="val_accuracy", choices=["val_accuracy", "val_auc"])
    parser.add_argument("--batch_size", type=int, default=12)
    args = parser.parse_args()
    print('[input params] {}'.format(args))

    return parser, args


if __name__ == '__main__':
    parser, args = parse_argvs()
    data_path = args.data_path
    model_path = args.model_path
    monitor = args.monitor
    epoch = args.epoch
    batch_size = args.batch_size

    # ====================================================================================
    # read data
    data_path = os.path.abspath(data_path)
    print("[DSSM] read file path: {}".format(data_path))
    train_data = pd.read_csv(os.path.join(data_path, "trainingSamples.csv"), sep=",")
    test_data = pd.read_csv(os.path.join(data_path, "testSamples.csv"), sep=",")
    data_pd = pd.concat([train_data, test_data])

    # ====================================================================================
    # define input for keras model
    columns_dict = {
        'movieId': 'int32',
        'movieGenre1': 'string',
        'movieAvgRating': 'float32',
        'userId': 'int32',
        'userGenre1': 'string',
        'userAvgRating': 'float32'
    }

    inputs = dict()
    for key in columns_dict.keys():
        inputs[key] = tf.keras.layers.Input(name=key, shape=(), dtype=columns_dict[key])
    print("[DSSM] input for keras model: \n {}".format(inputs))

    # ====================================================================================
    # movie embedding feature
    movie_col = tf.feature_column.categorical_column_with_identity(key='movieId', num_buckets=1001)
    movie_emb_col = tf.feature_column.embedding_column(movie_col, 10)

    movie_genre_1_vocab = data_pd['movieGenre1'].dropna().unique()
    movie_genre_1_col = tf.feature_column.categorical_column_with_vocabulary_list(key='movieGenre1',
                                                                                  vocabulary_list=movie_genre_1_vocab)
    movie_genre_1_emb_col = tf.feature_column.embedding_column(movie_genre_1_col, 10)

    movie_avg_rating = tf.feature_column.numeric_column(key='movieAvgRating')

    # user embedding feature
    user_col = tf.feature_column.categorical_column_with_identity(key='userId', num_buckets=30001)
    user_emb_col = tf.feature_column.embedding_column(user_col, 10)

    user_genre_1_vocab = data_pd['userGenre1'].dropna().unique()
    user_genre_1_col = tf.feature_column.categorical_column_with_vocabulary_list(key='userGenre1',
                                                                                 vocabulary_list=user_genre_1_vocab)
    user_genre_1_emb_col = tf.feature_column.embedding_column(user_genre_1_col, 100)

    user_avg_rating = tf.feature_column.numeric_column(key='userAvgRating')

    # ====================================================================================
    # train model
    model = dssm_model(feature_inputs=inputs,
                       item_feature_columns=[movie_emb_col, movie_genre_1_emb_col, movie_avg_rating],
                       user_feature_columns=[user_emb_col, user_genre_1_emb_col, user_avg_rating],
                       hidden_units=[30, 10])

    model.compile(
        loss='binary_crossentropy',
        optimizer='adam',
        metrics=['accuracy', tf.keras.metrics.AUC(curve='ROC')])

    filepath = os.path.join(model_path, "checkpoint", "dssm-weights-best.hdf5")
    checkpoint = tf.keras.callbacks.ModelCheckpoint(
        filepath, monitor=monitor, verbose=1, save_best_only=True, mode='max')

    train_data_input = gen_dataset(data_df=train_data, columns=columns_dict)
    model.fit(x=train_data_input, y=train_data["label"].values,
              epochs=epoch, callbacks=[checkpoint], verbose=2, batch_size=batch_size, validation_split=0.1)

    # ====================================================================================
    # predict, use best model.
    test_data_input = gen_dataset(data_df=test_data, columns=columns_dict)
    model.load_weights(filepath=filepath)

    pred_ans = model.predict(x=test_data_input, batch_size=batch_size)
    print("\n[BEST] ===============================================================")
    print("[test] LogLoss: {} ".format(round(log_loss(test_data["label"].values, pred_ans), 4)))
    print("[test] Accuracy: {} ".format(round(accuracy_score(test_data["label"].values, pred_ans >= 0.5), 4)))
    print("[test] AUC: {} ".format(round(roc_auc_score(test_data["label"].values, pred_ans), 4)))
    print("[test] classification_report: \n{} ".format(classification_report(test_data["label"].values, pred_ans >= 0.5, digits=4)))

    # ====================================================================================
    # save model
    model_path = os.path.abspath(model_path)
    print("[DSSM] save model path: {}".format(model_path))

    model.summary()
    tf.keras.models.save_model(
        model,
        os.path.join(model_path, "dssm"),
        overwrite=True,
        include_optimizer=True,
        save_format=None,
        signatures=None,
        options=None
    )

运行结果展示（部分）

需要获取训练数据和代码可以访问我的github，如果觉得有帮助，请star收藏，谢谢～

DSSM代码

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

算法

机器学习

【推荐算法】双塔模型代码（tensorflow）的相关文章

基于多目标粒子群算法的三个目标的支配解求解，基于多目标粒子群的帕累托前沿求解,基于多目标粒子群的三目标求解

目录摘要测试函数shubert 粒子群算法的原理粒子群算法的主要参数粒子群算法原理基于多目标粒子群算法的支配解求解基于多目标粒子群的帕累托前沿求解基于多目标粒子群的三目标求解代码结果分析展望代码下载基于多目标粒子群算
【数位dp】【动态规划】C++算法：233.数字 1 的个数

作者推荐动态规划 C 算法312 戳气球本文涉及的基础知识点动态规划数位dp LeetCode 233数字 1 的个数给定一个整数 n 计算所有小于等于 n 的非负整数中数字 1 出现的个数示例 1 输入 n 13 输出 6 示
自动驾驶轨迹预测

目录神经网络轨迹预测综述比较新的轨迹预测网络 Uber LaneRCNN 5 Google VectorNet 6 Huawei HOME 7 Waymo TNT 8 Aptive Covernet 9 NEC R2P2 10 商汤 T
工业异常检测AnomalyGPT-Demo试跑

写在前面如果你有大的cpu和gpu可以使用直接根据官方的安装说明就可以如果没有可以点进来试着看一下我个人的安装经验一试跑环境 NVIDIA4090显卡24g cpu内存33G 交换空间8g 操作系统ubuntu22 04 试跑过
【质量-弹簧-阻尼系统】基于脉冲响应约束的子空间辨识研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
小白刷题之图形输出

拓展 string string int num char ch num表示打印字符个数 ch表示打印内容 include
【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
2024年华为OD机试真题-转盘寿司-Java-OD统一考试（C卷）

题目描述寿司店周年庆正在举办优惠活动回馈新老客户寿司转盘上总共有n盘寿司 prices i 是第i盘寿司的价格如果客户选择了第i盘寿司寿司店免费赠送客户距离第i盘寿司最近的下一盘寿司 j 前提是prices j lt prices
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作3

题目描述问题描述定义一个N M N M lt 100 的矩阵将一个该矩阵的行和列的元素互换存到另一个二维数组中输入格式一行两个整数 N M 中间用空格隔开表示矩阵有N行 M列接下来共N行M列表示矩阵输出格式输出转置以后的
LeetCode解法汇总83. 删除排序链表中的重复元素

目录链接力扣编程题解法汇总分享记录 CSDN博客 GitHub同步刷题项目 https github com September26 java algorithms 原题链接力扣 LeetCode 描述给定一个已排序的链表的头
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
用栈实现队列（OJ中报错的处理）

用栈实现队列 ERROR AddressSanitizer myQueueFree函数中栈的释放处现了问题没有调用StackDestory而是直接free了这个是栈初始化时 capacity与malloc申请的空间大小没有匹配请你仅使
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车

随机推荐

第二十一章 webpack5原理loader概述

简介 loader其实是一个函数用来帮助 webpack 将不同类型的文件转换为 webpack 可识别的模块 loader的分类以及执行顺序 1 分类 pre 前置loader normal 普通loader inline 内联load
编译型语言和解释型语言各自的特点和区别，Python的解释器

编译型语言和解释型语言各自的特点和区别 Python的解释器编译型语言将源代码通过编译器编译生成可执行文件机器指令再由机器运行机器码解释型语言通过解释器逐行解释每一句源代码打个比方编译型相当于用中英文词典翻译器将一本英文
Vue如何封装组件

要封装一个 Vue 组件可以按照以下步骤进行操作创建一个新的 Vue 单文件组件 vue 文件并命名为你的组件名例如 MyComponent vue 在组件文件中使用
关于python传参引发的一些思考

人总有不会的遇到一些问题深究下去必定有所收获这个问题是在我写python爬虫项目的时候的疑问可能是我太菜了以前没学透彻也可能是上学期学Java的时候按值传递的特点给搞混了因为当时在用多线程的生产者消费者问题处理资源队列参考别人
task_5 - 副本

Task01 Task06树模型与集成学习笔记整理 1 Task01 信息论基础决策树分类思想用树的节点代表样本集合通过某些判定条件来对节点内的样本进行分配将它们划分到当前节点下的子节点这样决策树希望各个子节点中类别的纯度之和应高
内存文件系统提升磁盘性能瓶颈

author skate time 2011 08 22 提升磁盘性能瓶颈 linux的内存文件系统 ramdisk ramfs tmpfs ramdisk 是块设备在使用它们之前必须用选择文件系统将其格式化并且调整文件系统大小比较麻烦
【廖雪峰python进阶笔记】模块

1 导入模块要使用一个模块我们必须首先导入该模块 Python使用import语句导入一个模块例如导入系统自带的模块 math import math 你可以认为math就是一个指向已导入模块的变量通过该变量我们可以访问math
Python Pandas导出Hbase数据到dataframe

Python导出Hbase数据的思路使用happybase连接Hbase 使用table scan 扫数据将得到的数据整理为dataframe格式将从Hbase中得到的byte类型的数据转为str类型的数据示例代码 import h
数据结构之哈希（C++实现）

数据结构之哈希 C 1 哈希概念顺序结构以及平衡树中元素关键码与存储位置之间没有对应关系因此在查找一个元素的时候要经过关键码多次比较顺序表查找的时间复杂度为O N 而平衡树中树的高度为O log 2 N 搜索的效率取决于搜索过程中
Mybatis

文章目录前言业务逻辑使用Mybatis实现使用Mybatis plus实现前言工作的时候遇到了需要将一个数据库的一些数据插入或更新到另一个数据库一开始使用insert into TABLE col1 col2 VALUES
全国大学生计算机技能应用大赛Java模拟题

全国大学生计算机技能应用大赛Java模拟题竞赛官网 http www cnccac com 单选题 1 以下哪个不是java的垃圾回收算法 A 标记清除算法 B 空间分配算法 C 标记整理算法 D 分代回收算法 2 下列名称在java语言
cocos 基础动作加上简单特效

使用文理缓存创建精灵 cc Director getInstance getTextureCache addImage WechatIMG3 png localsp cc Sprite createWithTexture cc Direct
Error inflating class androidx.constraintlayout.widget.ConstraintLayout

今天下载了android studio 3 3 1体验体验新版本来着没想到新建项目直接来了个这个 android view InflateException Binary XML file line 2 Error inflating c
常见的距离算法和相似度（相关系数）计算方法

摘要 1 常见的距离算法 1 1欧几里得距离 Euclidean Distance 以及欧式距离的标准化 Standardized Euclidean distance 1 2马哈拉诺比斯距离 Mahalanobis Distance 1
vue3 ---- 递归组件生成menu菜单 && 路由守卫鉴权

目录递归组件 el menu 父组件子组件路由 Vue路由守卫实现登录鉴权全局守卫路由独享的守卫组件内的守卫完整的导航解析流程菜单权限按钮权限对于一些有规律的DOM结构如果我们再一遍遍的编写同样的代码显然代码是比较繁
IDEA切换分支导致项目异常, 部分类爆红问题解决

关于idea切换分支导致项目异常爆红的方式解决两种办法 1 maven 并没有及时刷新所以当我们第一时间出现这个问题的时候首选是刷新maven 如图所示 2 如果刷新mavne 还是没有解决idea 项目爆红的情况的话那我们就需要考
计算机不能创建用户,Windows10系统无法创建新用户该怎么办？

由于工作需要需要对同一台计算机创建多个用户帐户 Windows7操作系统创建新用户的方法很简单简单几步就能够轻松完成创建参照Windows7操作系统创建新用户的步骤发现并不适用于Windows10操作系统系统会提示需要登录Micr
CocosCreator波浪Shader

waveEffect effect Copyright c 2017 2020 Xiamen Yaji Software Co Ltd CCEffect techniques passes vert sprite vs vert frag
Serverless 的前世今生

作者阿里云用户组从云计算到 Serverless 架构大家好我是阿里云 Serverless 产品经理刘宇很高兴可以和大家一起探索 Serverless 架构的前世今生从云计算到云原生再到 Serverless 架构技术飞速发
【推荐算法】双塔模型代码（tensorflow）

推荐算法双塔模型介绍 MachineCYL的博客 CSDN博客上文介绍了双塔模型的原理和结构这篇介绍一下双塔模型的代码实现我使用的是tensorflow来实现双塔模型和模型训练一前期准备 tensorflow使用的版本是2 0

【推荐算法】双塔模型代码（tensorflow）

一、前期准备

二、详细代码

【推荐算法】双塔模型代码（tensorflow） 的相关文章

随机推荐

热门标签

【推荐算法】双塔模型代码（tensorflow）的相关文章