Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
【论文阅读】learning with noisy correspondence for cross-modal matching ------ 跨模态匹配,噪声对应
注意 本博客非逐字逐句翻译论文 是作者阅读论文后根据自己的理解所写 预知论文详情 请参阅论文原文 论文标题 Learning with Noisy Correspondence for Cross modal Matching 作者 Zhe
论文阅读笔记
深度学习
计算机视觉
神经网络
自然语言处理
CROSSFORMER: A VERSATILE VISION TRANSFORMER BASED ON CROSS-SCALE ATTENTION 论文阅读笔记
CROSSFORMER A VERSATILE VISION TRANSFORMER BASED ON CROSS SCALE ATTENTION 论文阅读笔记 这是浙大 腾讯 哥伦比亚大学一起发表在ICCV的一篇文章 文章有三个贡献 一是
论文阅读笔记
Transformer
深度学习
Pytorch
SimSiam:Exploring Simple Siamese Representation Learning
Siamese网络最大化了一个图像的两个增强之间的相似性 服从于避免崩溃解的某些条件 在本文中 SimSiam即使 不使用以下任何一项也可以学习有意义的表示 i 负样本对 ii 大批量 iii 动量编码器 我们的实验表明 停止梯度stop
论文阅读笔记
论文阅读
计算机视觉
深度学习
人工智能
【论文阅读笔记】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks
代码地址 https github com ZhaofanQiu pseudo 3d residual networks 主要贡献 以经济且有效的方式构建了仿3D卷积神经网络模型 P3D ResNet 出发点 3D 卷积神经网络能够同时学习
论文阅读笔记
【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测,多模态融合
本博客系本人理解该论文之后所写 非逐句翻译 预知该论文详情 请参阅论文原文 论文标题 Multimodal Fusion with Co Attention Networks for Fake News Detection 作者 Yang
论文阅读笔记
机器学习
自然语言处理
图像处理
CLIP:Contrastive Language-Image Pre-Training
参考博客 CLIP论文阅读 Learning Transferable Visual Models From Natural Language Supervision CLIP Connecting Text and Images 引言 在
论文阅读笔记
人工智能
机器学习
深度学习
基于深度学习的三维人体姿态估计
目录 一 技术背景 1 1 人体姿态估计 1 2 三维人体重建 1 4 构建多人场景研究情况 二 技术方法 2 1 基础架构 2 2 重叠loss 2 3 深度顺序感知loss 四 存在的问题与未来研究热点 4 1 本实验方法存在的问题 4
人工智能
机器学习
论文阅读笔记
深度学习
将GAN用于语义分割
深度学习已经在图像分类 检测 分割 高分辨率图像生成等诸多领域取得了突破性的成绩 但是它也存在一些问题 首先 它与传统的机器学习方法一样 通常假设训练数据与测试数据服从同样的分布 或者是在训练数据上的预测结果与在测试数据上的预测结果服从同样
论文阅读笔记
【图像去模糊】Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring论文笔记
一 论文概述 一般因动态场景造成的非均匀模糊是图像去模糊中一个具有挑战性的问题 这类模糊由相机抖动 场景深度以及多个对象运动造成 消除这类复杂运动模糊 传统的基于简单假设的方法不在适用 在本文中 作者提出了一种多尺度卷积神经网络 以端到端的
论文阅读笔记
图像处理
OCR文本检测模型:FCENet论文阅读笔记
文章目录 前言 摘要 Abstract 1 介绍 Introduction 2 相关工作 Related Work 3 方法 Approach 3 1 傅里叶轮廓嵌入 Fourier Contour Embedding 3 2 FCENet
论文阅读笔记
文本检测
OCR
深度学习
COR文本检测
【arxiv】Few-Shot Text Generation with Pattern-Exploiting Training
原文链接 https arxiv org pdf 2012 11926 pdf Abstract 为预先训练好的语言模型提供简单的任务描述或自然语言提示 可以在文本分类任务产生令人印象深刻的few shot结果 在本文中 我们表明了这个潜在
promp相关
论文阅读笔记
自然语言处理
深度学习
机器学习
LBP算法及其改进算法
LBP LBP指局部二值模式 英文全称 Local Binary Pattern 是一种用来描述图像局部特征的算子 LBP特征具有灰度不变性和旋转不变性等显著优点 它是由T Ojala M Pietik inen 和 D Harwood在1
算法
论文阅读笔记
计算机视觉
opencv
论文阅读笔记:Learning from Task Descriptions
0 简介 论文名字 Learning from Task Descriptions 下载地址 https www aclweb org anthology 2020 emnlp main 105 会议 ACL 2020 1 论文的motiv
论文阅读笔记
深度学习
机器学习
人工智能
笔记:深度学习与有向无环图SVM结合用于年龄估计的局部调整
阅读论文 Combined Deep Learning With Directed Acyclic Graph SVM for Local Adjustment of Age Estimation IEEE Journals Magazin
论文阅读笔记
年龄估计
深度学习
SVM
【图像去模糊2】SRN-DeblurNet论文笔记
一 论文概述 本论文中 作者研究了图像去模糊中的 coarse to fine 方案并提出了一个尺度循环网络 SRN DeblurNet 用于图像去模糊任务 该网络具有更简单的网络结构 更少的参数数量并且更容易训练 二 论文的提出背景 图像
论文阅读笔记
【超分辨率】(EDSR)Enhanced Deep Residual Networks for Single Image Super-Resolution论文阅读笔记
论文名称 Enhanced Deep Residual Networks for Single Image Super Resolution 论文下载地址 https arxiv org pdf 1707 02921 pdf 论文代码地址
论文阅读笔记
图像处理
论文阅读
深度学习
人工智能
【论文阅读笔记】里程计ODO/INS不同融合方式的性能比较
文章目录 一 里程计的工作原理二 论文中的主要结论三 总结四 参考文献 欢迎关注个人公众号 xff1a 导航员学习札记 关于里程计的融合一般用 距离增量修正 和 速度修正 两种方式 我最近在想这两种方式在性能上有什么不同 xff0c 因此找
ODO
ins
论文阅读笔记
不同融合方式的性能比较
自动驾驶之MultiPath++论文阅读笔记
预测道路参与者的future behavior 摘要 将输入由dense image based encoding改为a sparse encoding of heterogeneous scene elements 即用polylines
MultiPath
自动驾驶之
论文阅读笔记
GVINS论文阅读笔记
Code Pseudorange Measurement c o d e p s e
GVINS
论文阅读笔记
论文阅读笔记:GENERATING NATURAL ADVERSARIAL EXAMPLES
论文阅读笔记 xff1a GENERATING NATURAL ADVERSARIAL EXAMPLES 本文发表在ICLR2018上 问题 传统对抗样本是unnatural的 xff0c 在真实数据中几乎不存在 contribution
Generating
NATURAL
Adversarial
Examples
论文阅读笔记
1
2
»