多模态学习-基于文本和图像信息的商品分类框架

2023-11-12

将文本model和图像model合并为一个model,因为它们包含了互补的信息。

对于图像和文本数据,都是用CNN。对图像数据,使用已经在Image-Net上训练过的网络,该网络已经具有为自然图像提取丰富特征的能力。利用预先训练的机器学习模型称为转移学习。对文本数据,使用一个预先在商品标题上训练好的TextCNN模型。

利用预先训练的机器学习模型对新场景重新训练学习的过程称为转移学习。

我们希望从这两个模型的交互中获得更大的收益,所有我们创建了两个CNN分枝,一个分枝接受向量话的图像,一个分枝接受向量话的文本。整个架构如下:


效果评估

直接使用两个模型,和联合到一起的模型:

Images Text Images + Text
85% 86% 93%

预训练的VGG网络是在Image-Net的1000个类上的训练结果,没有一个是服装或图书,所以可以使用特征类目对其进行微调,我们选择了微调最后3个卷积层,下面是微调后的训练结果:

Images Text Images + Text Images + Text + Fine Tuning
85% 86% 93% 94%


尝试:

3.图像model先在真实类目上微调。

4.交替训练还是联合训练。

5.用LSTM-attention代替TextCNN。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

多模态学习-基于文本和图像信息的商品分类框架 的相关文章

  • 部署 Exchange Server后不能登录到 OWA 或 ECP

    1 问题现象 症状 安装 Microsoft Exchange Server 2019 2016 或 2013 的 2021 年 7 月安全更新或任何更高版本的更新后 用户无法登录 Outlook 网页版 OWA 或 Exchange 控制
  • 离散制造与流程制造的区别

    导 读 nbsp 文 1878 nbsp 对于产品制造 我们常常听到离散制造 流程制造这样的分类 相信大部分读者在面对实际的生产时 也能很好地凭借经验 感觉区分出产品的制造类别 本文旨在进一步帮助读者梳理清晰离散制造与流程制造准确定义 详细
  • layui框架和vue哪个好_目前流行的9大前端框架

    1 Vue https cn vuejs org Vue 读音 vju 类似于 view 是一套用于构建用户界面的 渐进式框架 与其它大型框架不同的是 Vue 被设计为可以自底向上逐层应用 Vue 的核心库只关注视图层 不仅易于上手 还便于
  • 报名倒计时|码住 2023 Google 开发者大会精彩活动!

    2023 Google 开发者大会 9 月 6 日正式开幕 即刻抓住报名机会 亲身体验大会精彩 仅出于确认身份 请填写与身份证件一致的姓名 并确认邮箱地址及联系电话准确无误 本次大会亮点多多 精彩纷呈 来到现场之前 让我们一起先睹为快 大会
  • Hive中常见的错误

    小编用的Cloudera Manager搭建的集群 因为服务器升级 集群停掉之后再启动的时候遇到了各种问题 Hive是常用的大数据组件 在此小编特意整理了Hive在使用过程中常见的错误如下 以供大家参考 由于造成错误的原因是多方面的 下面列
  • 根据经纬度获取当地时区,设置时区

    时区除了我们经常用的东八区 新需求是根据经纬度获取当地时区 并且将设备上的时区更新到当前时区 获取当前位置的经纬度是基本要求 本项目中有获取全球任意城市的天气需求 所以两个功能我就结合起来做了 1 获取天气信息 Api地址 Current
  • 开源ETL工具:Talend系列

    2019独角兽企业重金招聘Python工程师标准 gt gt gt Talend Open Studio 拓蓝开放工作室 Talend的旗舰产品 Talend Open Studio 提供了迄今市场上最为开放 最具效力并最有创造力的数据集成
  • VUE实现box-shadow生成器

    最终效果 Html结构 一层结构 div class body div class container div class result div div class setting div div class code container
  • SQL 子查询

    查询 query 任何SQL语句都是查询 但此术语一般指SELECT语句 SQL还允许创建子查询 subquery 即嵌套在其他查询中的查询 为什么要这样做呢 理解这个概念的最好方法是考察几个例子 利用子查询进行过滤 订单存储在两个表中 每
  • c++中的左值与右值

    c 中的左值与右值
  • 编码: ASCII(ANSI), GB-2312, UNICODE, UTF-8,UTF-16

    几年前 我在初次接触Unicode时学习过一段时间的编码 当时解决了问题就没有继续下去 我记得当时遗留下来的一个问题就是UTF 8到底是怎样一种编码 和Unicode有什么区别 为什么有了Unicode还要有UTF 8 最近又遇到了UTF
  • sockjs.min.js

    链接 https pan baidu com s 15Gn9uJ1W7i9WgPrgIB1z7Q 提取码 oy34 过期私我更新
  • 16 个必知必会的Python编码技巧,越早知道越好

    介绍 Python 是一门用途广泛的编程语言 它具有大量的库和框架 有一些鲜为人知的 Python 编码技巧和库可以让你作为开发人员的工作更为轻松 编写代码更高效 本文中将探讨一些鲜为人知的 Python 技巧 这些技巧非常有用 但并不广为
  • 均值已知检验方差_了解假设检验

    假设检验是统计推断的另一个重要的应用 在分布未知或部分已知的情况下提出对总体的某种假设 比如总体的数学期望 方差以及分布 与参数估计类似 需要基于假设找到适合的检验统计量 通过计算检验统计量的值来确定是否接受假设 通常在方差已知的情况下我们
  • PAT A1123 2019.09.05 【AVL建树 层序判断完全二叉树】

    1123 Is It a Complete AVL Tree 30 分 An AVL tree is a self balancing binary search tree In an AVL tree the heights of the
  • vue-router跳转用法详解(新手必看)

    vue router是一个单页面的路由器 也就是说所有的跳转都会在这个页面实现 这种只需要跳转页面 不需要添加验证方法的情况 可以使用
  • MySQL学习(六)——SQL的语言规范

    1 SQL的两个重要标准 SQL92 和SQL99 2 SQL分类 数据定义语言 DDL Data Definition Languages 对数据库结构的操作 定义了不同的数据库 表 视图 索引等数据库对象 还可以用来增删改数据库和数据表
  • 微信小程序热门搜索功能实现

    微信小程序点击搜索按钮 弹出遮罩层 显示热门搜索和搜索功能界面 搜索框 遮罩 图层 input 热门搜索 页面元素自动换行 效果 点击搜索框 弹出第二个视图层 显示input搜索框 并自动弹出键盘 代码
  • js几种生成随机颜色方法

  • 栈抽象数据类型及Python实现

    目录 栈的实现 栈的应用 十进制转化为二进制 中缀转后缀 后缀表达式求值 栈的实现 栈Stack 一种有次序的数据项集合 在栈中 数据项的加入和移除都仅发生在同一端 一端叫栈 顶top 另一端叫栈 底base 栈的特性 反转次序 在栈中数据

随机推荐

  • 安卓页面布局中android:gravity与android:layout_gravity的区别

    android gravity 指的是在控件内的元素要排布的方向 android layout gravity 指的是该控件相对于父控件的显示位置 当这俩个属性取多个值时可以使用 来分隔 且在LinearLayout布局中 使用androi
  • 手把手教你用matlab做深度学习(二)- --CNN

    在上一篇博客中 讲解了怎么用matlab搭建CNN网络模型 并给出了训练过程与结果 但是结果不是很满意 大概训练精度在80 左右 现在给出改进方案 1 首先 我们可以把CNN滤波输出数改大点 从原来的32改为numFilters 128 完
  • 在线图片尺寸修改 生成图标

    https www sojson com image change html https www idc yun com index php icon make 工具机 https www idc yun com index php uti
  • python输出希腊字母

    24个希腊字母 一 希腊字母及读音 二 Python输出 三 发现问题 一 希腊字母及读音 大写 小写 英文读音 中文读音 Alpha 阿尔法 Beta 贝塔 Gamma 伽马 Delta 德尔塔 Epsilon 艾普西隆 Zeta 泽塔
  • R数据分析:方法与案例详解--自学笔记

    TOC 目录 第二章 数据结构与基本运算 2 1 数据类型 数值型 numeric 整数 小数 科学数 字符型 character 夹杂单引号或者双引号之间 MR 逻辑型 只能读取T TRUE 或 F FALSE 值 复数型 a bi 原始
  • Java框架简介

    一 框架介绍 1 SpringBoot SpringBoot是Spring家族中一个全新框架 用来简化Spring应用程序的创建和开发过程 特性 1 一个快速开发框架 能够快速创建基于Spring的应用程序 2 能够直接使用java mai
  • Jenkins管理Docker容器

    一 Docker镜像容器手动更新流程 1 Docker安装 curl o etc yum repos d epel repo http mirrors aliyun com repo epel 7 repo curl o etc yum r
  • ajax的添加,在ajax中添加更多参数

    我正在使用AJAX功能 我使用AJAX将3个变量传递到下一页 当我添加第4个变量时 函数不会被调用 Code Browser Support Code function ajaxFunction var ajaxRequest The va
  • 超大规模数据库集群保稳系列之一:高可用系统

    基于过去多年在大规模数据集群保稳方面的实践经验 我们希望能够跟业界进行一些技术交流 美团技术团队举办了第75期技术沙龙 我们邀请到了美团研究员赵应钢担任出品人 同时请邀请到张洪 王占全 蔺瑞超 沈裕锋等4位数据库方向的4位技术专家 围绕进攻
  • C++虚拟机制的压制

    C 中 如果一个类有虚拟函数的时候 当使用该类的指针调用其虚函数的时候 代码会被编译器转换为使用虚函数表中保存的函数地址找到函数后二次调用 即 class A public virtual void Out this gt Inner vi
  • ue4绘制线的三种方式

    第一种方式 是用样条线 简明扼要 但是打包后就消失了 AActor actor world gt SpawnActor lt AActor gt ActorClass actor gt AttachToActor this FAttachm
  • 步进及伺服调试中常见问题

    步进及伺服调试中常见问题 步进 伺服 步进 1 步进电机驱动器可以接收两种脉冲信号 一种单脉冲方式 一种是双脉冲方式 可通过驱动器拨码开关设置进行选择 试分别画出两种方式的信号图 单脉冲方式脉冲信号从脉冲端 PUL 输入 通过方向端 DIR
  • java实现域名解析

    java实现域名解析 域名解析过程 浏览器检查是否有该域名缓存 检查本机host文件之内是否有该域名对应ip 检查本机DNS缓存 递归或迭代向DNS根域名服务器获取该域名ip地址 1 windows控制台 win r 输入cmd进入控制台
  • C语言常见校验(加密)操作——异或

    在通讯传输数据过程中 往往要加校验码 今天写了个简单的异或以及解异或的操作代码 include
  • arcsde安装步骤_ArcGIS 9.3 安装之 SDE的安装及使用

    由于ArcSDE9 3只支持Oracle 11gR1 32位版本 所以要在安装ArcSDE的电脑上安装一个32位版本的Oracle 11gR1客户端 1 安装SDE程序 并进行注册 1 选择注册机KeyGen exe 点击server标签
  • Vue3中父子组件实现数据双向绑定效果

    父组件
  • MarkDown/README.md文件添加图片

    README md文件添加图片 用MarkDown格式的文档编辑时 需要上传图片 比如往gitHub上的README md中添加一张展示效果图 alt text path to img jpg Title 其中 path to img jp
  • 树莓派设置静态IP记录(整理)

    另外 树莓派直连电脑 设置静态ip 可参考 http blog csdn net liang890319 article details 8639128 树莓派默认使用的是dhcp自动分配ip 而且默认打开SSH服务 当没有显示器的时候 我
  • 面试官:Spring refresh过程是怎样的?

    小熊学Java网站 https javaxiaobear gitee io 每周持续更新干货 建议收藏 1 Spring refresh 流程 refresh 是 AbstractApplicationContext 中的核心方法 负责初始
  • 多模态学习-基于文本和图像信息的商品分类框架

    将文本model和图像model合并为一个model 因为它们包含了互补的信息 对于图像和文本数据 都是用CNN 对图像数据 使用已经在Image Net上训练过的网络 该网络已经具有为自然图像提取丰富特征的能力 利用预先训练的机器学习模型