Ai challenger 2017 image caption小结

2023-05-16

参加了今年的ai challenger 的image caption比赛，最终很幸运的获得了第二名。这里小结一下。

Pytorch 越来越火了。。前五名有三个pytorch，两个tensorflow 关于哪个learning frame work 更适合图像nlp相关的应用我觉得用户用脚投票使用程度说明一切。tensorflow有强大的slim图像库支持，比如nasnet是slim最先支持的毕竟google原版。。。,但是在很多比赛灵活性上对比pytorch还有欠缺比如强化学习feed dict较慢，比如多模型ensemble实现per step的投票 beam search比较麻烦，甚至一个in graph的beam seach相比pytorch也麻烦很多，希望后面eagar模式能改变这些。
最佳的caption利器当属微软的

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

来自 <https://arxiv.org/abs/1707.07998>

前五名除了我都使用这个思路，因此我的单模型效果(show attention and tell)是相对最差的。。
强化学习非常重要

其它选手都通过强化学习大大提升了客观分数，但是仅仅优化类似cider这样的指标的强化学习可能会使得句子通顺度弱于优化cross entropy可能是这个原因我的主观流畅性打分最高..
调参和一些细节是至关重要的
1. 比如lstm hidden size 大部分选手可能使用512 而有的选手使用2048 提升明显
我使用light gbm 进行gbdt rerank将cider提升了10个点这里为 lightgbm 打call， 194w样本，52维特征，5交叉验证regression 只需要3分钟， lamdamart 排序只需要5分钟。
这里开源了本次比赛我使用的代码，欢迎contribute，特别是对强化学习的修改及改进，很遗憾尽管我也实现了scst但是没有达到理想效果几个指标只有meteor提升，其余指标下降。

https://github.com/chenghuige/image-caption-ai-challenger2017

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

challenger

2017

image

caption

Ai challenger 2017 image caption小结的相关文章

ImageMagick - 向图像添加白色透明覆盖层

我需要拍摄一张正常的图像并添加白色透明覆盖层使其看起来像这样不要注意转换后图像上的文本或它是原始图像的裁剪版本这一事实我需要简单地将顶部转换为完全相同的图像只是使用白色透明的覆盖层我还需要它是一个 cli 命令更新答案这更容
当我使用 ctx.drawImage() 在画布中放置另一个图像时，无法将画布另存为图像

我正在尝试制作绘图应用程序您可以在画布上绘制一些内容并通过单击保存按钮将结果保存为服务器上的图像您还可以放置另一张图像作为绘图的背景问题是当我使用 ctx drawImage 将图像放入画布时我无法将画布保存为图像因为什么
如何在Android中将图像文件转换为pdf文件

我正在尝试在 Android 应用程序中将图像文件 jpg 转换为 pdf 文件我用过itextpdf罐子和机器人文本罐都不适合我下面是使用时的代码itextpdf Document document new Document Str
Fabric JS ClipPath：裁剪后如何使图像适合画布？

我使用 FabricJS 和 ClipPath 属性实现了图像裁剪问题是如何使裁剪后的图像适合画布我希望裁剪后的图像填充画布区域但不知道是否可以使用 Fabric js 来完成因此我希望用户单击裁剪按钮后图像的选定部分适合画布
Android - GC 滞后于列表视图滚动“更大”的图像

在列表视图中我想在列表条目上绘制一个图像这 20 张图像必须缩放以填充垂直模式的宽度手机分辨率为 480 x 800 像素 SGS2 图像分辨率为 400x400 大小约为 100KB 我已将图像放在可绘制文件夹中当我滚动列表时它
JQuery 可拖动图像并保存位置

好吧这变得很尴尬已经搜索并尝试了大约 5 个小时但我只是在兜圈子场景很简单它是用户个人资料的标题图像可以将其拖动到某个位置然后将图像的顶部位置保存到数据库中感谢 Beetroot Beetroot 的遏制父级我开始关注
使用 Dragstart PreventDefault 禁用浏览器默认图像拖动，但它也禁用我的拖动事件

我尝试阻止浏览器默认图像在dragstart中拖动但不知何故它也禁用了drag和dragend事件无论如何我可以禁用浏览器默认图像拖动但它仍然会运行拖动和拖动结束事件或者唯一的选择是使用背景图像我不想这样做因为我需要因此更改很
来自无符号字符缓冲区的 QImage（jpg 格式）

我有类型的缓冲区unsigned char 我用JPG图像填充我想使用此缓冲区将图像绘制到 QLabel 中的应用程序屏幕上我已经这样做了但图像不正确谁能告诉我最好的方法是什么 QPixmap pix QPixmap fromIma
捕获的图像总是显示横向并且无法解决setRotate

这里有很多类似的主题和问题我关注this https stackoverflow com a 12933632 5257704 但我收到错误 My Code Override protected void onActivityResult
将pillow Image对象转换为JpegImageFile对象

我裁剪了一张 jpeg 图像但裁剪后的图像类型是
具有相对 URL 的 CSS 图像有时相对于 IE 中的页面 URL

我似乎发现 IE 有时会尝试使用相对 URL 加载 CSS 图像相对于页面 url 而不是 CSS 文件 url 示例有人加载此网址 https www main events com event 234 my awesome show
用Python识别图像

我对 OCR 识别和 Python 都有点陌生我想要实现的是从 Python 脚本运行 Tesseract 以识别 tif 中的某些特定数字我以为我可以为 Tesseract 做一些培训但我在 Google 和 SO 上没有找到任何
ImageMagick 更改图像宽度和高度

我正在使用 ImageMagick 通过使用下面的命令行选项来调整图像分辨率 convert abc png set units PixelsPerInch density 75 abc a png 我需要这个如果任何图像的宽度超过 30
在 javascript/jquery 中获取图像的完整尺寸

我在页面上有一个图像该图像已调整大小以适合 div 例如 400x300 如何在 jQuery 中获取图像的完整尺寸 4000x3000 width 和 height 似乎只返回图像的当前大小图像有naturalWidth and na
人体的宽度和高度

如何识别图像中人体的高度和宽度你需要一些参考点除非您知道相机设置位置变焦镜头畸变等以及人相对于相机的位置否则简单的照片是不够的如果您确实有参考例如背景中的网格或其他东西那么您可以测量网格并从那里开始听起来不像你需要的
CSS - 将文本保留在图像下方

我正在尝试创建一个简单的图片库有人告诉我使用 float left 但是当我这样做时页脚中的所有文本都会射到第一张图像我已经搜索了大约一个小时试图找到解决方案但我找不到任何东西我尝试过使用边距边框不同的对齐方式和各种不同的小东
我应该如何使用 jcrop 在客户端裁剪图像并上传？

我正在开发一个包含文件上传 HTML 控件的组件在使用文件上传元素选择图像后该图像将呈现在 HTML5 Canvas 元素上这是带有示例代码的 JSFiddle https jsfiddle net govi20 spmc7ymp h
减少1000张图片的HTTP请求？

我知道这个问题可能听起来有点疯狂但我想也许有人会想出一个聪明的主意假设您在一个 HTML 页面上有 1000 个缩略图图像大小约为5 10 kb 有没有办法在单个请求中加载所有图像以某种方式将所有图像压缩到一个文件中或者您对该主题
如何在 Python 中将图像分割成多个部分

我正在尝试使用 PIL 将一张照片分成多块 def crop Path input height width i k x y page im Image open input imgwidth im size 0 imgheight im
图像未显示在从 HTML 创建的 PDF 上

我想动态创建 PDF 这意味着我将从 Google Drive 获取文件然后将它们放入 HTML 代码中并尝试从中创建 PDF 一切工作正常除了图像没有显示我现在正在做的是从 HTML 字符串创建 HtmlOutput 获取该 H

随机推荐

Xmanager 远程连接linux ubuntu桌面操作系统

Xmanager 远程连接linux ubuntu桌面操作系统 Xmanager 下载地址 url http dl pconline com cn download 53773 html url 1 ubuntu desk操作系统的配置系
c语言中strtok函数_在C语言中使用strtok（）和strtok_r（）函数

c语言中strtok函数 In this article we ll take a look at using the strtok and strtok r functions in C 在本文中 xff0c 我们将介绍如何在C语言中使用
Qt QTreeWidget节点的添加+双击响应+删除详解

QTreeWidget是实现树形结构的类 xff0c 在很多软件中都可以看到类似树形结构的界面我做的一个示例如下图 xff0c 用来处理图像 xff0c 最顶层节点是图像的路径名 xff0c 子节点是图像的各个波段 xff0c 双击各个波
【转】如何使用分区助手完美迁移系统到SSD固态硬盘？

自从SSD固态硬盘出世以来 xff0c 一直都被持续关注着 xff0c SSD的性能优势让无数用户起了将操作系统迁移到SSD的心思 xff0c 直接后果就是让无数机械硬盘为止黯然退场 xff0c 很多软件都可以做到系统迁移 xff0c 然而
Python中import的使用

python中的import语句是用来导入模块的 xff0c 在python模块库中有着大量的模块可供使用 xff0c 要想使用这些文件需要用import语句把指定模块导入到当前程序中 import语句的作用 import语句作用就是用来导
android studio 安卓集成高德地图获取app定位信息

在网上搜索过大量集成高德地图的方案 xff0c 和测试代码 xff0c 要么就是博主抄来没有测试过的代码 xff0c 要么就是步骤不连续的 xff0c 甚至包裹官网给出的解决方案都是欠缺相关步骤的 xff08 官网截图都不知道多少年前的了
Mac操作系统下怎么显示隐藏文件

方法一 xff1a 第一步 xff1a 打开终端应用程序第二步 xff1a 输入如下命令 xff1a defaults write com apple finder AppleShowAllFiles boolean true kil
Linux : brctl not found

Getting this error message while trying to bring up your newly configured bridge interface on RHEL CentOS Linux You are
查看supervisor启动日志

2019独角兽企业重金招聘Python工程师标准 gt gt gt tail f var log messages 转载于 https my oschina net u 3371661 blog 3045059
嵌入式就业前景怎么样？嵌入式工作该如何分类？

随着科技进步 xff0c 嵌入式的出现 xff0c 以及人们对生活质量 xff0c 产品的智能化 xff0c 成本的要求等 xff0c 以及国家对与物联网电子科技的扶持 xff0c 大量的电子产品都促使嵌入式的快速发展嵌入式涵盖了微电
【vivado】ILA调试报错 The debug hub core was not detected 以及 Data read from hw_ila [hw_ila_1] is corrupted...

报错一 xff1a WARNING Labtools 27 3361 The debug hub core was not detected Resolution 1 Make sure the clock connected to the
面试题：你在项目中遇到哪些问题？

你在项目中遇到哪些问题 xff1f 因为目前项目采用的是分布式 xff0c 分布式环境下一般采用集群方案 xff0c 所以这就会带来分布式的一些问题 xff0c 比如 xff1a 1 分布式锁 2 分布式session 3 分布式全局id
检查 ubuntu 版本_如何检查Ubuntu版本–快速简便的方法

检查 ubuntu 版本 In this tutorial we will go over the easiest methods to check Ubuntu version from the terminal You can use
hashheap python　实现

class Node object 34 34 34 the type of class stored in the hashmap in case there are many same heights in the heap maint
Cocos Creator 实现大厅+子游戏模式

大厅 43 子游戏的模式 xff0c 在棋牌类型教育类型游戏中比较常见 xff0c 通常是安装包里面只有大厅的资源和代码 xff0c 然后子游戏根据需求以热更新的方式下载来提供给玩家之前一直负责的是cocos2dx lua的开发 xff
matlab练习程序（Kruskal最小生成树）

老物了 xff0c 网上的例子多的数不过来不过我还是有必要练习一下的之所以看这个算法是因为最近在看颜色聚合向量时 xff0c 有的论文用到了最小生成树 xff0c 因此我就拿来熟悉一下 Kruskal算法类似于连通分支算法 xff0c
Ubuntu18.04创建新的系统用户

目标 xff1a 1 为测试学习Docker xff0c 在虚拟机OS为18 04里 xff0c 创建一个系统账号 xff0c 账号名称 xff1a docker 2 在 home下有新建username的文件夹一建立账号 1 以roo
gooreplacer 很好用

国内上 StackOverflow hackernews 之类的站点会慢因为页面里有链接指向 google 谷歌会被墙于是拖累了整个页面的显示 gooreplacer 可以把这些被墙连接替换掉安装方法的话 xff0c 在浏览器的安装
vscod 技巧，自动循环书写li

ul gt li 10 这是第个li lt ul gt lt li gt 这是第1个li lt li gt lt li gt 这是第2个li lt li gt lt li gt 这是第3个li lt li gt lt li gt 这是第4
Ai challenger 2017 image caption小结

参加了今年的 ai challenger 的 image caption比赛 xff0c 最终很幸运的获得了第二名这里小结一下 Pytorch 越来越火了前五名有三个 pytorch xff0c 两个 tensorflow 关于哪个 l

Ai challenger 2017 image caption小结

Ai challenger 2017 image caption小结 的相关文章

随机推荐

热门标签

Ai challenger 2017 image caption小结的相关文章