论文阅读笔记

【论文阅读】learning with noisy correspondence for cross-modal matching ------ 跨模态匹配，噪声对应

注意本博客非逐字逐句翻译论文是作者阅读论文后根据自己的理解所写预知论文详情请参阅论文原文论文标题 Learning with Noisy Correspondence for Cross modal Matching 作者 Zhe

论文阅读笔记 深度学习 计算机视觉 神经网络 自然语言处理

CROSSFORMER: A VERSATILE VISION TRANSFORMER BASED ON CROSS-SCALE ATTENTION 论文阅读笔记

CROSSFORMER A VERSATILE VISION TRANSFORMER BASED ON CROSS SCALE ATTENTION 论文阅读笔记这是浙大腾讯哥伦比亚大学一起发表在ICCV的一篇文章文章有三个贡献一是

论文阅读笔记 Transformer 深度学习 Pytorch

SimSiam：Exploring Simple Siamese Representation Learning

Siamese网络最大化了一个图像的两个增强之间的相似性服从于避免崩溃解的某些条件在本文中 SimSiam即使不使用以下任何一项也可以学习有意义的表示 i 负样本对 ii 大批量 iii 动量编码器我们的实验表明停止梯度stop

论文阅读笔记 论文阅读 计算机视觉 深度学习 人工智能

【论文阅读笔记】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

代码地址 https github com ZhaofanQiu pseudo 3d residual networks 主要贡献以经济且有效的方式构建了仿3D卷积神经网络模型 P3D ResNet 出发点 3D 卷积神经网络能够同时学习

论文阅读笔记

【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测，多模态融合

本博客系本人理解该论文之后所写非逐句翻译预知该论文详情请参阅论文原文论文标题 Multimodal Fusion with Co Attention Networks for Fake News Detection 作者 Yang

论文阅读笔记 机器学习 自然语言处理 图像处理

CLIP：Contrastive Language-Image Pre-Training

参考博客 CLIP论文阅读 Learning Transferable Visual Models From Natural Language Supervision CLIP Connecting Text and Images 引言在

论文阅读笔记 人工智能 机器学习 深度学习

基于深度学习的三维人体姿态估计

目录一技术背景 1 1 人体姿态估计 1 2 三维人体重建 1 4 构建多人场景研究情况二技术方法 2 1 基础架构 2 2 重叠loss 2 3 深度顺序感知loss 四存在的问题与未来研究热点 4 1 本实验方法存在的问题 4

人工智能 机器学习 论文阅读笔记 深度学习

将GAN用于语义分割

深度学习已经在图像分类检测分割高分辨率图像生成等诸多领域取得了突破性的成绩但是它也存在一些问题首先它与传统的机器学习方法一样通常假设训练数据与测试数据服从同样的分布或者是在训练数据上的预测结果与在测试数据上的预测结果服从同样

论文阅读笔记

【图像去模糊】Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring论文笔记

一论文概述一般因动态场景造成的非均匀模糊是图像去模糊中一个具有挑战性的问题这类模糊由相机抖动场景深度以及多个对象运动造成消除这类复杂运动模糊传统的基于简单假设的方法不在适用在本文中作者提出了一种多尺度卷积神经网络以端到端的

论文阅读笔记 图像处理

OCR文本检测模型：FCENet论文阅读笔记

文章目录前言摘要 Abstract 1 介绍 Introduction 2 相关工作 Related Work 3 方法 Approach 3 1 傅里叶轮廓嵌入 Fourier Contour Embedding 3 2 FCENet

论文阅读笔记 文本检测 OCR 深度学习 COR文本检测

【arxiv】Few-Shot Text Generation with Pattern-Exploiting Training

原文链接 https arxiv org pdf 2012 11926 pdf Abstract 为预先训练好的语言模型提供简单的任务描述或自然语言提示可以在文本分类任务产生令人印象深刻的few shot结果在本文中我们表明了这个潜在

promp相关 论文阅读笔记 自然语言处理 深度学习 机器学习

LBP算法及其改进算法

LBP LBP指局部二值模式英文全称 Local Binary Pattern 是一种用来描述图像局部特征的算子 LBP特征具有灰度不变性和旋转不变性等显著优点它是由T Ojala M Pietik inen 和 D Harwood在1

算法 论文阅读笔记 计算机视觉 opencv

论文阅读笔记：Learning from Task Descriptions

0 简介论文名字 Learning from Task Descriptions 下载地址 https www aclweb org anthology 2020 emnlp main 105 会议 ACL 2020 1 论文的motiv

论文阅读笔记 深度学习 机器学习 人工智能

笔记：深度学习与有向无环图SVM结合用于年龄估计的局部调整

阅读论文 Combined Deep Learning With Directed Acyclic Graph SVM for Local Adjustment of Age Estimation IEEE Journals Magazin

论文阅读笔记 年龄估计 深度学习 SVM

【图像去模糊2】SRN-DeblurNet论文笔记

一论文概述本论文中作者研究了图像去模糊中的 coarse to fine 方案并提出了一个尺度循环网络 SRN DeblurNet 用于图像去模糊任务该网络具有更简单的网络结构更少的参数数量并且更容易训练二论文的提出背景图像

论文阅读笔记

【超分辨率】（EDSR）Enhanced Deep Residual Networks for Single Image Super-Resolution论文阅读笔记

论文名称 Enhanced Deep Residual Networks for Single Image Super Resolution 论文下载地址 https arxiv org pdf 1707 02921 pdf 论文代码地址

论文阅读笔记 图像处理 论文阅读 深度学习 人工智能

【论文阅读笔记】里程计ODO/INS不同融合方式的性能比较

文章目录一里程计的工作原理二论文中的主要结论三总结四参考文献欢迎关注个人公众号 xff1a 导航员学习札记关于里程计的融合一般用距离增量修正和速度修正两种方式我最近在想这两种方式在性能上有什么不同 xff0c 因此找

ODO ins 论文阅读笔记 不同融合方式的性能比较

自动驾驶之MultiPath++论文阅读笔记

预测道路参与者的future behavior 摘要将输入由dense image based encoding改为a sparse encoding of heterogeneous scene elements 即用polylines

MultiPath 自动驾驶之 论文阅读笔记

GVINS论文阅读笔记

Code Pseudorange Measurement c o d e p s e

GVINS 论文阅读笔记

论文阅读笔记：GENERATING NATURAL ADVERSARIAL EXAMPLES

论文阅读笔记 xff1a GENERATING NATURAL ADVERSARIAL EXAMPLES 本文发表在ICLR2018上问题传统对抗样本是unnatural的 xff0c 在真实数据中几乎不存在 contribution

Generating NATURAL Adversarial Examples 论文阅读笔记