CVPR 2019

2023-10-31

640


全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办。届时,旷视研究院将带领团队远赴盛会,助力计算机视觉技术的交流与落地。在此之前,旷视每周会介绍一篇被 CVPR 2019 接收的论文,本文是第 9 篇,旷视成都研究院提出一个极其简单但是高效、基于上下文信息的级联性年龄估计模型 ——C3AE。


640?wx_fmt=png


论文名称:C3AE: Exploring the Limits of Compact Model for Age Estimation

论文链接:https://arxiv.org/abs/1904.05059


  • 导语

  • 简介

  • 模型

    • 用于小尺寸图像的紧致模型:重新思考标准卷积

    • 年龄的两点表征

    • 级联训练

    • 基于周围环境的回归模型

  • 实验

    • 在 Morph II 上的对比

    • 在 FG-NET 上的对比

  • 结论

  • 参考文献

  • 往期解读

 

导语

 

在计算机视觉领域,年龄估计(Age Estimation)是一个经典的学习问题。随着 CNN 网络(比如 AlexNet、VGGNet、GoogLeNet、ResNet)不断变大变深,其性能也获得长足提升;但是上述模型并不适用于嵌入式/移动设备。

 

最近,MobileNet 和 ShuffleNet 系列算法降低参数数量,带来了轻量级模型。但是由于采用深度可分离卷积,特征表达能力被弱化。在调查了紧致模型(Compact Model)在中小尺度图像方面的局限性之后,旷视研究院提出了一个极其简单但高效的基于语境的年龄估计模型 ——C3AE。

 

相较于 MobileNets、ShuffleNets 和 VGGNet,该网络只有其 1/9 和 1/2000 的参数量,但取得了极具竞争力的性能。具体而言,旷视研究院把年龄估计问题重新定义为基于级联模型的两点表示;并且,为充分利用面部的上下文信息,提出了三分支 CNN 网络,以集成多个尺度的上下文信息。三个年龄估计数据集上的实验表明,C3AE 很大程度地推进了紧致模型的当前最佳性能。


简介

  

近年来,越大越深的卷积神经网络在带来精度提升的同时,也带来了计算成本前所未有的提升,无论是对于训练还是部署而言。具体而言,受限于模型大小和计算量,在智能手机、汽车、机器人等嵌入式/边缘设备上运行现有的大型模型(比如 AlexNet、VGGNet、ResNet、InceptionV1-V4)几近不可能。

 

为解决上述问题,最近,MobileNet 和 ShuffleNet 系列算法通过深度可分离卷积方法极大减少参数量,在这些模型中,传统的卷积被一个两步的改进卷积所替代,即逐通道卷积和逐点卷积。这两个系列算法将所有的关注点都集中在模型改进上,忽略了图像的输入尺寸也与模型设计息息相关,尤其是紧致性模型设计。事实上,卷积模块中的卷积层/或者池化层很大程度上类似直接对图像做下采样操作,但是其卷积层却耗费了大量的参数和计算量。

 

对于大尺寸图像而言,这样的操作(可分离卷积)是可行的,因为图像需要被大量通道所表征;对于低分辨率的中小尺寸图像来说,这就需要打问号。另外对于识别问题来说,许多高清的大尺度图像是没有必要的,几倍的下采样往往并不影响模型的性能,但却极大地影响着模型设计。

 

相较于大尺寸图像,中小尺寸图像经常只需要网络中更少的通道来表征,当然计算量和参数量也一样会大幅度减少。因此,和深度可分离卷积相比,中小尺寸图像的标准卷积层并不需要太多的参数和内存。

 

从图像表征的角度看,可分离卷积的输出通道数量是标准卷积的很多倍。为补偿表征能力,可分离卷积不得不增加参数。因此,旷视研究院认为,使用小卷积核的一般卷积层比深度可分离卷积层更适合处理中小尺寸图像。

 

之前的许多紧致性模型都在思考如何改进模型或者卷积层以满足现实需求,很少考虑图像的输入尺寸与模型设计的关系。对于一个识别系统来说,当图像清晰度合适时,许多低分辨率的图像往往也是非常合格的训练样本,如图 1 所示。

 

图像的存储和处理要在低分辨率、中小尺寸的情况下,即小图像运行在低功耗的移动设备上,年龄估计即是与此相关的困难问题之一。

 

比如,人们可以轻易地识别出图 1 中男人的年龄,不管他的脸是低分辨率、局部或是全局的。旷视研究院认为,当下的普通卷积神经网络同样可以拥有这种能力,通过设计一个带有标准卷积层的简单网络,并把中小尺寸人脸图像作为年龄估计的输入,也能设计一个非常紧致的模型。事实上,对图像进行下采样的过程就对应到神经网络中的池化过程,只是之前的许多工作都把研究重心放在了模型改进上。


640?wx_fmt=png

 图1:不管何种分辨率和大小,人们可以轻易识别上图男子的年龄。旷视研究院新方法 C3AE 把小尺寸图像(64 × 64 × 3)作为输入进行年龄估计,同样取得了不俗的效果

 

年龄估计的最新进展通常归纳为两个方向:1)联合分类与年龄值回归,2)分布匹配。在本文中,旷视研究院尝试同时利用分类、回归和标签分布的信息,它的实现是通过把年龄值表征为两个相邻年龄等级上的一个分布(如图 2 所示),并且训练目标是最小化分布之间的匹配(如图 3 所示)。

 

在深度回归模型中,会在特征层和年龄值预测层之间嵌入一个带有语义分布的全连接层,该全连接层即是预测的分布。

 

总体而言,旷视研究院设计了一个紧致模型,它把所有中/小尺度图像作为输入,使用标准卷积而不是深度卷积,其中能较好地控制特征层的通道数。据知,这应该是目前为止最小的人脸识别模型,基础模型仅 0.19 MB,完整模型约 0.25 MB;接着,旷视研究员把分离的年龄值表征为一个分布,并设计一个级联模型;进而,旷视研究员引入一个基于语境的回归模型,它把多个尺寸的人脸图像作为输入。

 

借助于这一简单的基础模型、级联式训练以及多尺寸语境,旷视研究院旨在解决所有的中小尺寸图像的年龄估计问题,这一方法称之为——C3AE。事实上这一思路可以推广到许多其他的应用中。


模型

  

旷视研究员首先展示了基础模型及其架构,接着描述了新的年龄两点表示方法,并通过级联的方式将其嵌入到深度回归模型中。随后,借助于三个不同尺度下的人脸信息,加入了基于周围环境信息的集成模块,通过共享的 CNN 嵌入到单一的回归模型中。

 

用于中小尺寸图像的紧致模型:重新思考标准卷积

 

本文的基础模型(plain model)由 5 个标准卷积和 2 个全连接层构成,如表 1 所示;旷视研究员还展示为什么使用标准的卷积模块而不是 MobileNet 和 ShuffleNet 系列模型所用的可分离的卷积模块。本文设计的基础模型极其简单,也不 fashion,但是一点也不影响其良好的性能。


640?wx_fmt=png

 表1:C3AE基础模型

 

在 MobileNet 系列模型中,对参数量与计算量降低方面的状况进行了分析,尤其是标准卷积和可分离卷积之间的对比。这一分析适用于大尺寸图像,而对于中、小尺寸图像,效果则不一定好。


年龄的两点表征

 

旷视研究员借助两点表征对年龄估计实现了重新定义,即把一个全新的年龄表征看作是两个离散且相邻的 bin 的一个分布。任意点的表征是通过两个邻近的 bin,而不是任意两个或多个 bin 来表示。显然,两点表征的分布是稀疏的,只有其中两个元素是非零的。

 

640?wx_fmt=png

 图3:借助两点表征重新定义年龄估计任务

 

级联训练


年龄值可由分布向量表征,但是分布向量的组合方式是多种多样的。两点表征很适合解决这种多样性的不足。那么下一个问题是,如何把向量信息嵌入到一个端到端的网络中。本文通过级联模型做到了这一步,如图 2 所示。具体而言,一个带有语义信息(年龄分布)的全连接层被嵌入到特征层和回归层之间,并使用 KL loss 进行约束。

 

640?wx_fmt=png

 图2:C3AE图示

 

基于周围环境的回归模型

 

中小尺寸图像的分辨率和大小是限定的,利用不同尺寸下的人脸信息很有必要。如图 1 所示,分辨率更高的图像有着丰富的局部信息,而分辨率较低的图像则有着全局信息和场景信息。除了挑选 SSR 中一个对齐的人脸框外,本文按照三个尺寸剪裁人脸中心,如图 2 所示,紧接着将其输入到共享的 CNN 网络,最后三种尺寸的人脸图像的特征通过级联模块之前的串联(concatenation)进行聚合。


实验

 

实验包含三个部分。第一部分是基础模型的对比实验(1):对比使用基础模型的 SSR、MobileNet V2、ShuffleNet V2 和 C3AE;第二部分是消去实验(2):讨论级联模块(两点表示)和基于周围场景模块的必要性;第三部分是与当前最优方法的一些对比实验。本文主要介绍第三部分。

 

在 Morph II 上的对比

 

如表 5 所示,在 Morph II 上,C3AE(full model)在从头开始训练和在 IMDB-WIKI 上预训练两种情况下分别取得了2.78 和 2.75 MAE,这是所有简单模型中的当前最佳结果;而C3AE(plain model)则直截了当地取得了 3.13 MAE。总之,C3AE 以超轻量级模型在 Morph II 上取得了很有竞争力的结果。

 

640?wx_fmt=png

 表5:C3AE在Morph II上的对比结果


在 FG-NET 上的对比

 

如表 6 所示,在 FG-NET 上,C3AE 与一些当前最优模型做了对比。通过平均绝对值损失,经过预训练的 MV 取得了最佳结果 2.68 MAE,而 C3AE 经过预训练实现的结果是 2.95 MAE 和 0.17 std,即第二优结果。此外,在没有预训练的情况下,C3AE 取得的结果 4.09 稍优于 MV 的 4.10。总之,在 FG-NET 上的对比证明了 C3AE 的有效性和竞争力。

 

640?wx_fmt=png

 表6:C3AE在FG-NET上的对比结果


结论

 

旷视研究院提出了一个极简单模型,称之为 C3AE,相较于其他简单模型(紧致性模型),C3AE 取得了当前最优的结果,且相比于大模型其表现也很有竞争力。多个消去实验也证明了 C3AE 各个模块的有效性。对于中小尺寸的图像和模型,本文也给出了一些分析和思考。未来,旷视研究院将会评估 C3AE 在一般数据集和更广泛应用上的有效性。

 

参考文献

 

Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep residuallearning for image recognition. In CVPR, 2016. 

Andrew G Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, WeijunWang, Tobias Weyand, Marco Andreetto, and Hartwig Adam. Mobilenets: Efficientconvolutional neural networks for mobile vision applications. arXiv preprintarXiv:1704.04861, 2017. 

Alex Krizhevsky, Ilya Sutskever, and Geoffrey E Hinton. Imagenetclassification with deep convolutional neural networks. In NIPS, 2012. 

Ningning Ma,Xiangyu Zhang, Hai-Tao Zheng, and Jian Sun. Shufflenetv2: Practical guidelines for efficient cnn architec- ture design. In ECCV,2018. 

Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zh- moginov, and Liang-Chieh Chen. Mobilenetv2: Inverted residuals and linear bottlenecks. In CVPR, 2018. 

X Zhang, X Zhou, M Lin, and J Sun. Shufflenet: An extremelyefficient convolutional neural network for mobile devices. arxiv 2017. arXivpreprint arXiv:1707.01083.

 

传送门

 

欢迎各位同学关注旷视成都研究院(及同名知乎专栏:https://zhuanlan.zhihu.com/c_1119253499380166656,简历可以投递给研究院负责人刘帅成(liushuaicheng@megvii.com)


往期解读:



640?



点击以下标题查看更多往期内容: 




640?#投 稿 通 道#

 让你的论文被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。


来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向) 

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接 

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志


? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site 

• 所有文章配图,请单独在附件中发送 

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通




?


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


640?

▽ 点击 | 阅读原文 | 获取最新论文推荐

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CVPR 2019 的相关文章

  • 某宝登录滑块拖动没反应解决,亲测有效

    这两天在抓取某宝数据的时候发现使用selenium登录时会有滑块 然后尝试使用xpath定位到滑块位置然后使用Actionchains拖动 但是发现滑块拖动没有反应 但是在抓取过程中的滑块拖动时没有问题的 如图所示 随后对代码进行调试 终于
  • 微信小程序开店怎么做?

    在日活量如此之高的微信里 很多商家都希望能再微信开一个小程序商店 来提高自己的一个卖货收益 那么微信小程序开店怎么做呢 下面跟大家分享一下微信小程序怎么开店 一 开通小程序账号 首先我们需要开通一个小程序账号 小程序账号的主体类型要企业或者
  • 学习一年Java的程序员的C++学习记录(指针引用绕晕记)

    文章目录 一 C 入门 二 变量和数据类型 三 运算符 四 流程控制 五 复合数据类型 六 函数 七 函数高阶 八 面向对象 一 C 入门 标准输出流中 cout 是一个ostream对象 lt lt 和 gt gt 是C 中经过重载的运算
  • 从谷歌宕机事件认识互联网工作原理

    摘要 谷歌服务器经历了短暂的宕机事件 持续大概27分钟 对部分地区的互联网用户造成了影响 此次事件的原因深究起来需要进入互联网络那深邃的 黑暗的角落 译者注 本文中提到CloudFlare是一家总部位于美国旧金山的内容分发网络 CDN 服务
  • 必备歌曲--超经典

    一些超经典的歌曲 看看你听过多少 1 陈慧琳 记事本 爱得痛了 痛的哭了 记载着我们过去的点点滴滴 让我们一起回忆 2 王力宏 唯一 悠扬 流畅 很有韵味的感觉 大声对你深爱的人说你是我的唯一王力宏新专辑首支主打歌 唯一 打动不少歌迷 觉得
  • 华为OD机试 - 跳房子I(Java)

    题目描述 跳房子 也叫跳飞机 是一种世界性的儿童游戏 游戏参与者需要分多个回合按顺序跳到第1格直到房子的最后一格 跳房子的过程中 可以向前跳 也可以向后跳 假设房子的总格数是count 小红每回合可能连续跳的步教都放在数组steps中 请问
  • shell 脚本中wait命令以及多进程库wait()原语的使用

    一 脚本源码 compute it 1 gt compute it 1 out compute it 2 gt compute it 2 out wait cat compute it 1 out cat compute it 2 out
  • 解决Spyder无法自动补全某些代码的问题

    今天在Spyder发现按tab代码无法自动补全 网上的方法全部试过了 如在ipython里面勾选greedy completion 和autocall选full 删除enum34 我根本就没有这个包 安装rope 安装正确版本的jedi和p
  • JAVA this关键字的使用(JacKing)

    1 对当前对象的引用 public class Leaf int i 0 Leaf increment i return this void print System out println i i public static void m
  • Unity3d trial version 水印

    使用个人免费版发布安卓手机版包 屏幕右下角显示 trial version 水印 解决办法 1 免费版Unity Hub 使用国外网络刷新证书 2 使用付费版Unity Hub
  • 美团笔试-回转寿司

    小美请小团吃回转寿司 转盘上有N盘寿司围成一圈 第1盘与第2盘相邻 第2盘与第3盘相邻 第N 1盘与第N盘相邻 第N盘与第1盘相邻 小团认为第i盘寿司的美味值为A i 可能是负值 如果小团讨厌这盘寿司 现在 小团要在转盘上选出连续的若干盘寿
  • Qt网络编程之实例一GET方式

    看了两天的Qt网络编程 其实主要就是看了看QNetworkAccessManager QNetworkRequest和QNetworkReply这三个类的主要内容 在之前 Qt网络编程主要是使用QHttp等类 但是现在在帮助手册中这些类已经
  • 2022年2月6日--2月12日(ue智慧城市3,4周,本周10小时,合计1929小时,剩余8071小时)

    目前 ue视频教程进行到了智 慧 城 市 3 11 mysql 7 1 tf1 4 11 蓝图反射 1 9 moba 1 5 webapp 2 4 mmoarpg 00A 04 socket 2 57 Opengl 5 9 GLSL 2 1
  • 汇编ret ,retf ,iret ,int指令详解

    ret指令 执行过程 ret指令用栈中的数据 修改IP的值 从而实现近转移 CPU执行ret指令时 进行下面两步操作 IP SS 16 SP SP SP 2 另一种用法 ret n n为整数 等效于 IP SS 16 SP SP SP 2
  • mysql索引的使用和讲解

    索引概述 索引是一个数据结构 索引是帮助 MySQL 高效获取数据的数据结构 有序 在数据之外 数据库系统还维护着满足特定查找算法的数据结构 这些数据结构以某种方式引用 指向 数据 这样就可以在这些数据结构上实现高级查询算法 这种数据结构就
  • 大数据毕设项目 基于python 爬虫 flask的疫情数据可视化系统

    文章目录 1 课题背景 2 实现效果 2 1 整体界面展示 2 2 31省病例柱形图 2 3 全国现有确诊人数趋势 2 4 中国累计确诊时间线 2 5 中国疫情情况饼状图 2 6 高风险树状图 3 相关理论及技术 3 1爬虫 3 2 Dja
  • 谷粒商城微服务分布式高级篇ElasticSearch五——商城业务-商品上架

    文章目录 商品上架 ES数据模型 上架流程 mybatis之foreach用法 TypeReference Feign调用流程 商品上架 后台管理员对spu审核进行操作 点击上架 只有当商品上架才应该被检索 即需要导入商品数据到ES中 请求
  • 神经网络是算法还是模型,神经网络 图像相似度

    神经网络的准确率是怎么计算的 其实神经网络的准确率的标准是自己定义的 我把你的例子赋予某种意义讲解 1 期望输出 1 0 0 1 每个元素代表一个属性是否存在 像着4个元素分别表示 是否肺炎 是否肝炎 是否肾炎 是否胆炎 1表示是 0表示不
  • 知乎:1.03亿月活用户,获得感战略下的内容质量和商业化布局难平衡

    点击上方蓝字关注我们 分析知乎财报 聊聊以下几点问题 知乎主要靠什么赚钱 知乎的收入来源 知乎在商业化方面做了那些探索 知乎的产品规划 玩过知乎的朋友 一定看到过以下短句 谢邀 人在美国 刚下飞机 圈内熟人太多 利益相关 匿了 在知乎回答中
  • 计算机防火墙不能更改,win7无法更改防火墙设置提示系统报错怎么办

    防火墙也称防护墙 是一种位于内部网络与外部网络之间的网络安全系统 可以防止病毒入侵 有位 Win7系统 用户想更改防火墙某些设置 出现无法更改的情况 系统报错 0x80074200 怎么办呢 下面小编告诉大家两种解决win7无法更改防火墙设

随机推荐

  • Qt实现单击或双击QTableWidge/View表头进行排序

    先看效果图 点击一次对应列进行降序 再点击一次进行升序 分别对应图1 图2 实现代码 构造函数中设置了一个sign以及关联对应的信号 双击表头的信号为sectionDoubleClickClicked m sign true 设置一个标志位
  • cpu中的MMU的作用

    虚拟内存与物理内存之间的映射 用户空间映射到物理内存是独立的 提高安全性 修改内存访问级别 0是最高级
  • 通过python控制GDB进行调试

    最近需要对自己开发RISC V Server调试器进行稳定性测试 所以需要通过使用自动化脚本进行测试 这里想通过Python编写脚本来控制GDB进行稳定性测试 Python中有一个库pygdbmi 代码如下 from pygdbmi gdb
  • crypto-js 前端DES加密/解密、生成秘钥 详解

    DES概述 DES全称为Data Encryption Standard 即数据加密标准 是一种使用密钥加密的块算法 1977年被美国联邦政府的国家标准局确定为联邦资料处理标准 FIPS 并授权在非密级政府通信中使用 随后该算法在国际上广泛
  • ts250服务器开启虚拟,ts250服务器恢复系统

    ts250服务器恢复系统 内容精选 换一换 数据分布问题简述分布式产生的根源是 规模 规模可理解为计算和存储的需求 当单机能力无法承载日益增长的计算存储需求时 就要寻求对系统的扩展方法 通常有两种扩展方式 提升单机能力 scale up 增
  • Python Pygame 实现宝可梦对战场面

    宝可梦游戏是小时候最喜欢的掌机游戏之一 印象最深刻的是宝可梦 黄 宝可梦 金 银 还有红蓝宝石 游戏的设计很出色 画面精致 可以说是是掌机时代的代表了 本篇文章使用Pygame实现宝可梦的战斗场景 重温经典 目录 一 游戏效果展示 二 使用
  • 基于DNN神经网络的多输入多输出数据回归预测

    基于DNN神经网络的多输入多输出数据回归预测 神经网络是一种被广泛应用于机器学习和人工智能领域的工具 它可以通过训练来学习输入和输出之间的关系 在回归预测问题中 神经网络可以通过学习历史数据来预测未来的结果 本篇文章将介绍如何使用DNN神经
  • Halcon仿射变换图片(旋转、缩放、平移)

    一 实验要求 把图片中的书摆正 二 实现代码 仅旋转 旋转变换 read image Image C Users 86159 Pictures Saved Pictures 1作业图片 5 2 1 jpg dev close window
  • Android之阿里云推送实现

    一 效果图 二 实现步骤 去阿里云官方注册账号及随便认证一下 然后去控制台创建自己的应用 控制台 gt 产品与服务 gt 移动服务 gt 移动推送 创建自己的项目 新建产品 新建成功后点击图标进入应用管理 点击加号进行应用配置 输入软件名及
  • IR2104/03 TLP250

    闸门驱动电源范围从10 20V 欠电压锁定 高侧输出与输入同步 关闭输入将关闭这两个通道 两个信道的匹配传输延迟 IR2104 S 高压 高速功率MOSFTE和IGBT驱动器 具有依赖的高侧和低侧参考输出通道 绝对最大额定参数 表明设备损坏
  • uni-app 怎么修改自定义组件样式 uniapp 覆盖 组件样式

    前段时间说到 由于Android和ios开发的小伙伴比较忙 我被拉来开发一个App 今天记录一下 uni app小程序怎么修改自定义组件样式 测试了h5和App端是可以的 小程序端没有测试 如果使用过vue开发项目 可以知道 当
  • Elasticsearch使用中出现的错误

    Elasticsearch使用中出现的错误 1 分页查询异常 在分页的过程中出现了一个问题是当查询的数据超过10000条的时候报了异常 from size must be less than or equal to 10000 这个问题最快
  • C++中的拷贝构造函数和以传值方式传递对象参数

    今天写一个小题 设11和12均为顺序表 编写一个函数 找出并输出他们的 最大子前级串 并比较剩余串的大小 在将对象作为参数传递给compare函数时 使用传引用的方式传递对象参数 编译可以通过 然而当我使用传值方式传递对象参数 编译器报错
  • 目标检测算法的分类和优缺点

    前言 一 基于深层神经网络的目标检测 1 是否存在候选区 2 是否存在先验框 二 各类目标检测算法的机制 优势 局限性及适用场景 三 目标检测的基本原理 总结 前言 随着今年来科学技术的发展 尤其是人工智能和大数据技术的不断发展 不断应用于
  • Numpy 向量化操作加速计算,解决向量外积求和慢的问题

    在计算函数二阶导的时候 我们通常需要计算Hessian 矩阵 此时会遇到向量外积求和的问题 i 1 n u i v i u i R n 1 v i R 1 n sum i 1 n u i v i u i in mathbb R n time
  • 经典排序算法之:快速排序

    快速排序可能是应用最广泛的排序算法 快速排序流行的原因是它实现简单 适用于各种不同的输入数据且在一般应用中比其他排序算法都要快很多 此次 我们来学习一下快速排序算法 目录 一 快速排序算法含义 二 快速排序算法过程 三 快速排序算法的过程方
  • ES7.5.2 script_score查询的bug

    背景 1 需要用到dense vector script score来进行算分 排序 2 ES版本为7 5 2 用到了自定义的插件 短期无法升级到7 17 5 或更高版本 3 script score查询在加入date类型的字段作为查询条件
  • 线程同步与锁

    线程同步与锁 当多个线程同时操作一个数据源的时候 需要留意数据源操作被重复同时执行 这个时候就需要考虑线程同步与锁的问题 线程同步与锁 使用关键字syncronized 来同步 syncronized修饰实例方法 直接在方法返回类型与修饰符
  • bash download.sh命令直接执行可以成功,通过代码执行却失败

    遇到了一个特别坑的问题 浪费了差不多两天时间 很气 需求 通过wget命令下载一个xml gz 一个xml文件的压缩包 代码 Runtime getRuntime exec bash BASH FILE Thread sleep 60 10
  • CVPR 2019

    全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16 20 日在美国洛杉矶举办 届时 旷视研究院将带领团队远赴盛会 助力计算机视觉技术的交流与落地 在此之前 旷视每周会介绍一篇被 CVPR 2019 接收的论文 本