在NLP上，CNN、RNN、MLP三者相比各有何优劣

2023-11-16

本文为知乎温颖就如下问题的回答，已授权CSDN转载
若想要实现某个具体的任务，如做关系抽取、实体识别、情感分类等。在不考虑实现的难度的情况下，如何从理论、经验、直觉上去选择最有希望的模型？

前段时间做过用不同的神经网络模型做文本分类/情感分析，都是基于词向量去做的，以下是我自己的一些感受：

MLP：因为句子长度不固定，所以一般是用Bag-of-Word-Vectors 简单将词向量相加，然后使用MLP，这个方法比较简单，训练速度比较快，得到的结果也不是很差。只是没有利用到上下文信息。

RNN：将句子或文本作为序列输入比较自然，可以利用到历史信息，将词的顺序也考虑进去。此外，RNN的使用有很多变化，最简单的是使用最基础的RNN将最后一个词的隐含层输出进行softmax，但这样越往后的词会显得越重要（因为从前向后，最后一个输入的信息会更多地留下来），或者将每个隐含层的输出的和和均值进行softmax。也可以将基础的RNN变化为使用LSTM（很容易过拟合）或GRU单元，或使用bi-RNN获取更多的上下文信息。最后结果上并没有比MLP的结果好很多，但训练速度上慢了很多。（PS: 我这里的RNN指Recurrent Neural Network）

CNN：这个方法看起来对处理这种序列输入不是很自然，所以一般是对句子的所有词的词向量使用不同大小的窗口（能获取一定前后文信息，有点像隐式的n-gram）进行一维的卷积，然后用最大池化获得最重要的影响因子（我个人觉得这个比较讲得通，因为文本中不是所有词对分类结果都有贡献）和定长输出。CNN的方法也训练起来也比较简单，现阶段最后实验的效果也是最好。但有一些窗口大小上选取的经验问题，对文本长程依赖上的问题也并不是很好解决，因为窗口大小一般不会选很大。

以上是我自己试验中得到的结果，结果根据不同的网络架构和参数可能会有变化，感觉还是得继续修炼好深度suan调ming参大法。

130+位讲师，16大分论坛，中国科学院院士陈润生、滴滴出行高级副总裁章文嵩、联想集团高级副总裁兼CTO芮勇、上交所前总工程师白硕等专家将亲临2016中国大数据技术大会，票价折扣即将结束，预购从速。

图片描述

想要更多干货？请关注CSDN人工智能公众号AI_Thinker。

图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在NLP上，CNN、RNN、MLP三者相比各有何优劣的相关文章

如何从另一种语言单词创建英文字母字符串？

我需要找到一种方法将某些语言的单词翻译重写为英语例如俄语听起来像privet 用英语讲含义和语法并不重要但我希望它听起来更相似一切都应该用Python编写我在网上努力查找但没有找到好的方法例如类似这样的事情 tran
训练新的 AutoTokenizer 拥抱脸部

收到此错误 AttributeError GPT2Tokenizer 对象没有属性 train new from iterator 与拥抱面部文档非常相似我更改了输入就是这样不应该影响它有一次就成功了 2小时后回来查看发现并没有
NLTK 中的 FreqDist 未对输出进行排序

我是 Python 新手我正在尝试自学语言处理 python 中的 NLTK 有一个名为 FreqDist 的函数可以给出文本中单词的频率但由于某种原因它无法正常工作这是教程让我写的 fdist1 FreqDist text1 vo
在哪里可以找到英语短语列表？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我的任务是搜索文本中陈词滥调和常见短语的用法这些短语与您在财富之轮的短语谜题中可能看到的短语类似这
如何在 python-gensim 中使用潜在狄利克雷分配（LDA）来抽象二元组主题而不是一元组？

LDA 原始输出一元语法主题1 水肺水蒸汽潜水主题2 二氧化物植物绿色碳所需输出二元组主题主题1 水肺潜水水蒸气主题2 绿色植物二氧化碳任何想法鉴于我有一个名为docs 包含文档中的单词列表我可以使用 n
如何将地名词典或词典表示为 crf++ 中的特征？

如何使用地名词典或词典作为功能CRF https taku910 github io crfpp 详细说明假设我想对人名进行 NER 并且我有一个包含常见人名的地名词典或字典我想使用这个地名词典作为 crf 的输入我该怎么做我正在
如何调整 NLTK 句子标记器

我正在使用 NLTK 来分析一些经典文本但我在按句子标记文本时遇到了麻烦例如这是我从以下内容中得到的片段莫比迪克 http www gutenberg org cache epub 2701 pg2701 txt import nlt
如何有效计算文档流中文档之间的相似度

我收集文本文档在 Node js 中其中一个文档i表示为单词列表考虑到新文档以文档流的形式出现计算这些文档之间相似性的有效方法是什么我目前对每个文档中单词的归一化频率使用余弦相似度我不使用 TF IDF 词频逆文档频率因为我
词干函数错误：词干需要一个位置参数

这里的stem函数显示错误指出stem需要循环中的一个位置参数如所讨论的 from nltk stem import PorterStemmer as ps text my name is pythonly and looking fo
target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么？

根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
否定句子的算法

我想知道是否有人熟悉算法句子否定的任何尝试例如给定一个句子这本书很好请提供任意数量的意思相反的替代句子例如这本书不好甚至这本书不好显然以高精度实现这一点可能超出了当前 NLP 的范围但我确信在这个主题上已经有了一些工作
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
用于估计（一元）困惑度的 NLTK 包

我正在尝试计算我所拥有的数据的困惑度我正在使用的代码是 import sys sys path append usr local anaconda lib python2 7 site packages nltk from nltk co
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
python中的语音识别持续时间设置问题

我有一个 Wav 格式的音频文件我想转录我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
如何检测文本是否可读？

我想知道是否有一种方法可以告诉给定的文本是人类可读的我所说的人类可读的意思是它有一些含义格式就像某人写的文章或者至少是由软件翻译器生成的供人类阅读的文章这是背景故事最近我正在制作一个应用程序允许用户将短文本上传到数据库在部署
如何在Python中使用多处理来加速循环执行

我有两个清单列表 A 包含 500 个单词列表 B 包含 10000 个单词我正在尝试为列表 A 找到与 B 相关的相似单词我正在使用 Spacy 的相似函数我面临的问题是计算需要很长时间我是多处理使用的新手因此请求帮助如何
缩短文本并仅保留重要句子

德国网站 nandoo net 提供了缩短新闻文章的可能性如果使用滑块更改百分比值文本会发生变化并且某些句子会被遗漏您可以在这里看到它的实际效果 http www nandoo net read article 299925 http
举例解释bpe（字节对编码）？

有人可以帮忙解释一下背后的基本概念吗BPE模型除了这张纸 https arxiv org abs 1508 07909 目前还没有那么多解释到目前为止我所知道的是它通过将罕见和未知的单词编码为子词单元序列来实现开放词汇表上的 NMT
除非 POS 显式，否则 WordNetLemmatizer 不会返回正确的引理 - Python NLTK

我正在对 Ted 数据集成绩单进行词形还原我注意到一些奇怪的事情并非所有单词都被词形还原要说的是 selected gt select 哪个是对的然而 involved gt involve and horsing gt horse

随机推荐

创建聚集索引

一 ibuf init at db start Creates the insert buffer data structure at a database startup and initializes the data structur
深度学习（十九）——FCN, SegNet, DeconvNet, DeepLab, ENet, GCN

前DL时代的语义分割续 Grab cut Grab cut是微软剑桥研究院于2004年提出的著名交互式图像语义分割方法与N cut一样 grab cut同样也是基于图划分不过grab cut是其改进版本可以看作迭代式的语义分割算法
JDBC操作

目录一实现JDBC步骤 1 注册驱动 1 1导入驱动包 1 1异常处理 2 创建连接 2 1导包 2 2处理异常 3 得到执行sql语句的Statement对象 3 1修改数据操作 3 2删除数据操作 3 3插入数据操作 3 4查询数据
vue-quill-editor富文本编辑器的汉化版及使用心得

现在网上上有很多的富文本编辑器但我个人还是非常喜欢Vue家族的vue quill deitor 虽然说它只支持IE10 好废话不多说直接上代码现在是见证奇迹的时刻在vue中使用quill呢我们需要npm进行安装安装命令如下第一
spring security 实现免登陆功能

spring security 实现免登陆功能大体也是基于COOKIE来实现的主要配置信息
Spring Boot系列之修改内置Tomcat版本

背景在 spring boot 出来之前或者没有使用 spring boot 时 Java EE 开发时如果选择 tomcat servlet 需要自己指定 tomcat 版本此处没有考虑那种直接把打包的 war 直接扔到本地安装的任
oracle云避坑小记

前言最近白嫖oracle云用于评估arm64 架构的服务器发现 oracle 云系统和国内的主要云服务厂商如阿里云或者腾讯云默认的一些策略有所不同以下是一些避坑指南一避坑小记基于 oracle linux 8 关闭 fi
《代码大全2》第3章三思而后行，前期准备

目录前言本章主题 3 1 前期准备的重要性 3 1 1 处于不同阶段强调质量 3 1 2 前期准备对构建活动的影响 3 1 3 准备不周全的诱因 3 1 4 我理解的准备周全纯属个人理解 3 2 辨明你所从事的软件的类型 3 2
vue.config.js

vue config js相关的知识信息一 vue config js是vue打包管理的配置文件旨在给开发者们自定义自己的配置 1 该文件的根式统一为导出配置项选项例如在对象里面书写我们自己的配置项目二具体的配置内容项目中常
0x00007FFD33144F99处（位于xx.exe中）引发的异常：Microsoft C++异常查处方法

一般这样的异常都是try catch语句有异常抛出比如新建一个工程 int main try throw 1 catch int excep if excep 1 printf throw 1 n return 0 运行就会在输出的调试信
CAD球体密堆积3D插件随机紧密堆积球体堆积结构

插件简介 CAD球体密堆积3D插件可用于生成随机紧密堆积的球体模型插件可指定投放区域球体集料的粒径范围球体数量等信息插件采用模拟重力作用下球体的碰撞堆积行为实现球体集料的随机紧密堆积模型插件通过AutoCAD软件进行绘图生成的
CloudCompare——点云标注

目录 1 概述 2 软件实现 3 合并点云 1 概述对给定的点云添加分类标签 2 软件实现 1 裁剪点云裁剪出需要标注的部分并选中 2 进行标注工具栏操作 Edit gt Scalar fields gt Add constant
[Python入门系列之十]Python 中的类和对象

Python 中的类和对象类和对象是面向对象编程 Object Oriented Programming 的基础类是一种用户定义的数据类型它封装了属性和方法用于描述某一类对象的行为和特征而对象则是类的实例化是具体的实际存在的实
Vue+ElementUI电商项目（六）

订单列表创建订单列表路由组件并添加路由规则在view中新建orderManagement文件夹新建Order vue组件组件中添加代码如下
Pandas基本操作——增加、修改和删除

数据的增加按列增加数据按行增加数据增加多行数据修改数据修改列标题使用DataFrame对象的columns属性直接赋值使用DataFrame对象的rename方法修改列标题修改行标题使用DataFrame对象的index属
vue3：el-table多选框设置默认选中，翻页保留选中状态

问题 el table多选框设置默认选中进行翻页之前选中的数据没有保留选中状态
设计模式-模板方法模式

一模板方法模式定义定义一个操作中的算法骨架而将一些步骤延迟到子类模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤类型行为型模式特点通过把不变的行为搬移到超类去除子类中的重复代码来体现它的优势提供了
【4】数据结构与算法--- 数据结构进阶

第 3 章数据结构进阶 3 1 线性表线性表按照某种线性关系存储下来的表分类线性表说明顺序表将数据放在一个连续的存储空间链表把数据分散存储按照某种关系连成串分类单向链表双向链表单向循环链表 3 2 顺序表 3
python怎么一次输入两个数_python如何一次性输入多个数

python一次性输入多个数的方法 1 输入两个数字 m n map int input split 2 输入三个及三个以上数字 a b c d map int input split python一次性输入多个数的方法 1 输入一个数字直
在NLP上，CNN、RNN、MLP三者相比各有何优劣

本文为知乎温颖就如下问题的回答已授权CSDN转载若想要实现某个具体的任务如做关系抽取实体识别情感分类等在不考虑实现的难度的情况下如何从理论经验直觉上去选择最有希望的模型前段时间做过用不同的神经网络模型做文本分类情感分析

在NLP上，CNN、RNN、MLP三者相比各有何优劣

在NLP上，CNN、RNN、MLP三者相比各有何优劣 的相关文章

随机推荐

热门标签

在NLP上，CNN、RNN、MLP三者相比各有何优劣的相关文章