支持向量机或人工神经网络进行文本处理？ [关闭]

2024-05-10

对于某些文本处理项目，我们需要在支持向量机和快速人工神经网络之间做出选择。

它包括上下文拼写纠正，然后将文本标记为某些短语及其同义词。

哪种方法才是正确的？或者有没有比 FANN 和 SVM 更合适的替代方案？

我认为您将从这两种算法中获得有竞争力的结果，因此您应该汇总结果......考虑集成学习。

Update:
我不知道这是否足够具体：使用贝叶斯最优分类器来组合每个算法的预测。您必须训练两种算法，然后必须训练贝叶斯最优分类器以使用您的算法并根据算法的输入做出最佳预测。

将训练数据分成 3 部分：

第一个数据集将用于训练（人工）神经网络和支持向量机。
第二个数据集将用于通过从 ANN 和 SVM 获取原始预测来训练贝叶斯最优分类器。
第三个数据集将是您的资格数据集，您将在其中测试经过训练的贝叶斯最佳分类器。

更新2.0：
创建算法集合的另一种方法是使用10 倍（或更一般地，k 倍）交叉验证 http://www.cs.cmu.edu/~schneide/tut5/node42.html:

将数据分成 10 组，大小为 n/10。
在 9 个数据集上进行训练并在 1 个数据集上进行测试。
重复 10 次并取平均准确度。

请记住，您通常可以组合许多分类器和验证方法，以产生更好的结果。这只是找到最适合您的域的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

artificialintelligence

machinelearning

neuralnetwork

支持向量机或人工神经网络进行文本处理？ [关闭] 的相关文章

Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
R 中 svm 特征选择的示例

我正在尝试使用 R 包在 SVM 中应用特征选择例如递归特征选择我已经安装了 Weka 它支持 LibSVM 中的特征选择但我还没有找到任何 SVM 语法的示例或类似的东西一个简短的例子会有很大的帮助功能rfe in the ca
我可以在反向传播期间（有选择地）反转 Theano 梯度吗？

我热衷于利用最近论文中提出的架构通过反向传播进行无监督域适应 http arxiv org pdf 1409 7495 pdf 在 Lasagne Theano 框架中这篇论文的有点不同寻常之处在于它包含了一个梯度反转层 invert
R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集我想绘制多类别分类的 ROC 曲线 Achim Zeileis 给出的第一个答案非常好 R中使用rpart包的ROC曲线 https stackoverflow com questions 30818188
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
用于神经网络模型预测的数据的缺失值

我目前有大量数据将用于训练预测神经网络美国主要机场的千兆字节天气数据我几乎每天都有数据但有些机场的数据中存在缺失值例如机场在 1995 年之前可能不存在因此在此之前我没有该特定位置的数据此外有些还缺少整年可能跨度为 199
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
Java 的支持向量机？

我想用Java编写一个智能监视器它可以随时发出警报detects即将到来的性能问题我的 Java 应用程序正在以结构化格式将数据写入日志文件
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
在 Keras 中连接两个目录迭代器

假设我有类似以下内容 image data generator ImageDataGenerator rescale 1 255 train generator image data generator flow from director
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection

随机推荐

JavaScript：事件处理程序：在哪里声明变量 - 本地变量还是闭包（与开销）？

我发现自己编写了各种包含事件处理程序的函数感觉最好在父函数闭包的根部声明处理函数所需的变量特别是如果它们是 jQuery 选择多个处理程序所需的常量或者需要一些我不想要的预计算每次触发事件时重复一个简单的例子 var touc
如何使用nodejs/aws-sdk将base64编码的pdf直接上传到s3？

我正在尝试使用以下代码将 base64 编码的 pdf 上传到 S3 而无需将文件写入文件系统 const AWS require aws sdk exports putBase64 async object name buffer buc
ReverseProxy取决于golang中的request.Body

我想构建一个 http 反向代理它检查 HTTP 主体然后将 HTTP 请求发送到它的上游服务器你怎么能在 Go 中做到这一点初始尝试如下失败因为 ReverseProxy 复制传入请求修改它并发送但正文已被读取 func
Contenteditable - 从插入符号提取文本到元素末尾

浏览完所有可能的问题和答案后我会尝试这种方式我正在编写 RTE 程序但未能成功提取 contenteditable 元素中的文本原因是每个浏览器处理节点和按键 13 事件的方式略有不同例如一个浏览器创建 br 另一个浏览器创建
ASP.Net Web API 与 WCF，我的项目中应该选择哪一个

到目前为止我已经在网络上阅读了很多关于 WCF 和 ASP Net Web API 之间的差异的文章不幸的是我无法清楚地知道什么才能达到我的目的我读过的大多数文章都强调了这两个 Web 服务的设计观点但我很困惑什么最适合我的项目
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
如何在 swift 3 中的表视图单元格中实现集合视图的分页？

在这里我有一个布局其中我的表视图单元格之一由集合视图组成在这个布局中我需要实现分页但我无法使用func collectionView collectionView UICollectionView willDisplay cell
根据列A：列B范围内的值查找数据框中的相应行[重复]

这个问题在这里已经有答案了我有一个 data frame 和一个向量例如 df data frame id 1 3 start c 1 1000 16000 end c 100 1100 16100 info c a b c vec c
使用 .NET 将两个 PNG 图像合并为一张图像

我有两个其实很多 PNG http en wikipedia org wiki Portable Network Graphics png 我的应用程序中的图像两者都有透明区域我想在我的应用程序中拍摄两个图像将它们组合起来并将结果
单击 C# 表单 X 按钮

如何确定表单是否通过单击 X 按钮或 this Close 关闭表格有事件表格关闭带有类型参数表单关闭事件参数 catch the form closing event private void Form1 FormClosing obj
将 fetch 与 Content-Type 结合使用时出现 CORS 错误 [重复]

这个问题在这里已经有答案了我正在尝试从 FireFox 中的不同域向 REST Web 服务发送 POST 请求我为此使用 JavaScript 获取函数我在 IIS 中托管 REST Web 服务在我在 JavaScript 中
将 django Charfield "\t" 转换为制表符

我有一个带有 Charfield 的 django 模型其中包含 unicode 转义字符串 t 将其转换为真正的选项卡的最简单方法是什么如str t 找到了答案 t decode string escape 如上所述here http
绝对元素后面元素上的文本选择

我有一个覆盖元素它隐藏了其他包含文本的 div 覆盖元素是绝对定位的我希望用户能够选择这些 div 后面的文本我的解决方案是隐藏用户事件 mouseDown 上的覆盖层显示无并在 mouseUp 事件发生时再次显示它这样一旦
如何在 C# 中将内容添加到 google doc 表格单元格

我正在尝试将 3x3 表格插入 google 文档然后使用 c 将文本插入表格单元格我遇到了这个thread https stackoverflow com questions 56735529 how to add content t
vs2008循环引用（c#）

这是我在 vs2008 解决方案中的设置名为 MyProject Data 的项目中的数据层名为 MyProject Web 的项目中的 Web 应用程序 MyProject Web 引用了 MyProject Data 在 MyPro
是否可以在 js