Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
显存不够,如何训练大型神经网络
之前写过一篇PyTorch节省显存的文章 在此基础上进行补充 老博文传送门 本篇参考自夕小瑶的卖萌屋公众号 一 单卡加载大型网络 1 1 梯度累加Gradient Accumulation 单卡加载大型网络 一般受限于大量的网络参数 训练时
NLP
神经网络
GPT,GPT-2,GPT-3,InstructGPT的进化之路
ChatGPT 火遍圈内外 突然之间 好多人开始想要了解 NLP 这个领域 想知道 ChatGPT 到底是个什么 作为在这个行业奋斗5年的从业者 真的很开心让人们知道有一群人在干着这么样的一件事情 这也是我结合各位大佬的文章 总结下GPT
NLP
GPT大模型
算法
gpt
深度学习
对比学习:MoCo :Momentum Contrast for Unsupervised Visual Representation Learning
参考链接 论文链接 https link zhihu com target https 3A arxiv org abs 1911 05722 代码链接 https github com facebookresearch moco Intr
NLP
CNN(卷积神经网络)在自然语言处理中的应用
本文参考自Convolutional Neural Networks for Sentence Classification 结尾处放上传送门 用传统方法进行文本分类任务时 通常将一篇文档所对应的tf idf 向量作为模型的特征输入 但是这
深度学习
自然语言处理(nlp)
NLP
自然语言处理
cnn
机器学习(SVM)文本分类
训练 coding utf 8 Project company Author little fly File name 文本分类 Create time 2020 10 31 9 48 导入必要的包 import jieba import
自然语言处理
NLP
机器学习
ner计算准召的坑
1 踩了个大坑 记录一下 声明 不喜欢写estimator所以才踩的坑 1 from tensorflow contrib import crf 如果想使用这个函数 tensorflow的版本号要在1 14以下 1 12就可以 不要相信那些
自然语言处理
NLP
实体识别
tensorflow
深度学习
推荐一下《探索推荐引擎内部的秘密》
推荐一下 IBM软件工程师赵晨婷和马春娥的系列文章 探索推荐引擎内部的秘密 IBM Developworks 探索推荐引擎内部的秘密 第 1 部分 推荐引擎初探 http www ibm com developerworks cn web
NLP
引擎
ibm
算法
ChatGPT fine tune微调+prompt介绍
目录 1 如何使用ChatGPT 1 1 图片生成 image generation 1 2 对话 chat 1 3 中文纠错 Chinese Spelling Correct 1 4 关键词提取 keyword extract 1 5 抽
NLP
ChatGPT
python
人工智能
深度学习
文本聚类(二)—— KMeans 聚类
目录 二 KMeans 聚类 2 1 加载数据集 2 2 数据清洗 2 3 文本向量化 2 4 文本聚类 2 5 关键词展示 2 6 判定最佳聚类数 参考文档 在第一篇内容中 我们介绍了 LDA 主题模型 这一篇 我们将介绍经典的 KMea
NLP
kmeans算法
实现基于LSTM的情感分析
文章目录 实现基于LSTM的情感分析 1 情感分析 常用的数据集及开源库 1 1 常用数据集 1 1 1 亚马逊产品评价 1 1 2 Yelp餐饮评价 1 1 3 电影评价 1 1 4 亚马逊食品评价 1 1 5 航空公司Twitter评价
NLP
深度学习
AI
LSTM
【Pytorch】BERT+LSTM+多头自注意力(文本分类)
Pytorch BERT LSTM 多头自注意力 文本分类 2018年Google提出了BERT 1 Bidirectional Encoder Representations from Transformers 预训练模型 刷新了11项N
NLP
LSTM
自注意力
Pytorch
(二)ChatGLM-6B模型部署以及ptuning微调详细教程
文章目录 介绍什么是ChatGLM 6B Torch 安装ChatGLM 6B模型 安装过程 Ptuning微调 安装过程 初始化环境 训练 准备自己的数据集 推理 验证 问题和思考 泛化学习 simbert 不属于必学 介绍什么是Chat
NLP
python
开发语言
ChatGLM-6B之SSE通信(Server-sent Events)
目录 研究历程 只是感受 不感兴趣的这段可以跳过 直接看下边的正题 找 正题 二字 正题 1 SSE Server sent Events 2 ChatGLM的流式方法 3 ChatGLM之SSE通信 写这篇博客还是很激动开心的 因为是我经
python
ChatGLM
NLP
SSE
算法
【论文&模型讲解】VideoBERT: A Joint Model for Video and Language Representation Learning
文章目录 前言 0 摘要 1 Introduction 2 相关工作 3 模型 3 1 BERT 3 2 VideoBERT 4 实验与分析 4 1 数据集 4 2 视频和语言预处理 4 3 模型预训练 4 4 zero shot 动作分类
多模态
人工智能
深度学习
计算机视觉
NLP
【小沐学NLP】Python实现聊天机器人(微软Azure机器人服务)
NLP开发系列相关文章编写如下 1 小沐学NLP Python实现词云图 2 小沐学NLP Python实现图片文字识别 3 小沐学NLP Python实现中文 英文分词 4 小沐学NLP Python实现聊天机器人 ELIZA 5 小沐学
python
NLP
Microsoft
npl
【代码笔记】Transformer代码详细解读
Transformer代码详细解读 文章目录 Transformer代码详细解读 简介 1 数据准备 1 1 词表构建 1 2 数据构建 2 模型整体架构 2 1 超参数设置 2 2 整体架构 2 2 模型训练 3 编码器 Encoder
NLP
代码笔记
Transformer
深度学习
自然语言处理
【动手学习pytorch笔记】37.5 BERT微调
BERT微调 import json import multiprocessing import os import torch from torch import nn from d2l import torch as d2l bert
pytorch学习笔记
Pytorch
学习
Bert
NLP
【OpenAI 多模态预训练】VideoGPT?微软透露GPT-4或将在下周发布
多模态预训练 VideoGPT 微软透露GPT 4或将在下周发布 先让我猜个名字 VideoGPT 太绝了 看完ChatGPT之后就感觉OpenAI正在做多模态的预训练语言模型 万万没想到来的这么快 据介绍 GPT 4或将为多模态大模型 将
NLP
NLG
人工智能
深度学习
Keras—embedding嵌入层的使用
最近在工作中进行了NLP的内容 使用的还是Keras中embedding的词嵌入来做的 Keras中embedding层做一下介绍 中文文档地址 https keras io zh layers embeddings 参数如下 其中参数重点
NLP
Keras
Embedding
«
1 ...
38
39
40
41
42
43
44
»