Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Pytorch深度强化学习案例:基于Q-Learning的机器人走迷宫
目录 0 专栏介绍 1 Q Learning算法原理 2 强化学习基本框架 3 机器人走迷宫算法 3 1 迷宫环境 3 2 状态 动作和奖励 3 3 Q Learning算法实现 3 4 完成训练
pytorch深度学习实战
Pytorch
人工智能
python
机器人
Pytorch深度强化学习案例:基于Q-Learning的机器人走迷宫
目录 0 专栏介绍 1 Q Learning算法原理 2 强化学习基本框架 3 机器人走迷宫算法 3 1 迷宫环境 3 2 状态 动作和奖励 3 3 Q Learning算法实现 3 4 完成训练
pytorch深度学习实战
Pytorch
人工智能
python
机器人
Pytorch深度强化学习1-5:详解蒙特卡洛强化学习原理
目录 0 专栏介绍 1 蒙特卡洛强化学习 2 策略评估原理 3 策略改进原理 3 1 同轨蒙特卡洛强化学习 3 2 离轨蒙特卡洛强化学习 0 专栏介绍 本专栏重点介绍强化学习技术的数学原理 并且 采用Pytorch框架对常见的强化学习算法
pytorch深度学习实战
Pytorch
人工智能
python
机器学习
一步一步详解LSTM网络【从RNN到LSTM到GRU等,直至attention】
一步一步详解LSTM网络 从RNN到LSTM到GRU等 直至attention 0 前言 1 Recurrent Neural Networks循环神经网络 2 The Problem of Long Term Dependencies长期
pytorch深度学习实战
RNN
LSTM
GRU
人工智能
SPPNet详解(白话讲解——附图文)
SPPNet是何凯明大神提出的 为了解决R CNN中速度慢问题 在神经网络中输入图片的尺寸必须是固定的 这是因为在设计的时候FC层中神经元的个数都是固定的 导致输入图片尺寸必须是固定的 CNN是可以适应不同尺寸的输入图片 说明在CNN后面加
深度学习
python
pytorch深度学习实战
神经网络
计算机视觉
一步一步详解LSTM网络【从RNN到LSTM到GRU等,直至attention】
一步一步详解LSTM网络 从RNN到LSTM到GRU等 直至attention 0 前言 1 Recurrent Neural Networks循环神经网络 2 The Problem of Long Term Dependencies长期
pytorch深度学习实战
RNN
LSTM
GRU
人工智能
【论文精读ACL_2021】Prefix-Tuning: Optimizing Continuous Prompts for Generation
论文精读ACL 2021 Prefix Tuning Optimizing Continuous Prompts for Generation 0 前言 Abstract 1 Introduction 2 Related Work 2 1
pytorch深度学习实战
人工智能
深度学习
微调
Prefix tuning
(2020)End-to-end Neural Coreference Resolution论文笔记
2020End to end Neural Coreference Resolution论文笔记 Abstract 1 Introduction 2 Related Work 3 Task 4 Model 4 1 Scoring Archi
pytorch深度学习实战
论文阅读
机器学习
指代消解
共指消解
T5的整体介绍【代码实战】
T5的整体介绍 代码实战 0 前言 1 Header 2 summary 3 T5 model 3 1 forward 3 2 预训练任务 3 2 1 multi sentence pairs 3 3 完成 tasks 0 前言 本文是对T
pytorch深度学习实战
python
开发语言
NLP
深度学习