了解随机起始权重对神经网络性能的影响

2024-04-17

使用 R 和包neuralnet，我尝试对数据进行建模，如下所示：

这些是几天内以 10 分钟为间隔的温度读数（上面是 2 天的截图）。使用下面的代码，我将神经网络拟合到数据。可能有更简单的方法来对这些精确数据进行建模，但将来数据可能看起来完全不同。使用带有 2 个神经元的单个隐藏层给了我令人满意的结果：

这也有效大多数时候有更多的层和神经元。然而，一个隐藏层和一个神经元偶尔有两层（在我的例子中分别是 3 和 2 个神经元），我得到的结果相当差，总是具有相同的形状：

唯一随机的是起始权重的初始化，所以我认为它与此相关。然而，我必须承认我还没有完全掌握神经网络的理论。我想知道的是，糟糕的结果是否是由于局部最小值（“神经网络”默认使用带有权重回溯的弹性反向传播）而我只是运气不好，或者我是否可以避免这种情况。我的印象是，存在用于拟合的隐藏节点的最佳数量，例如2、5、10 次多项式。如果不是，我最好的做法是什么？更大的学习率？误差阈值更小？提前致谢。

I have not尝试调整 rprop 参数，所以解决方案可能就在那里。

Code:

# DATA ----------------------
minute <- seq(0, 6*24 - 1)
temp <- rep.int(17, 6*24)
temp[(6*7):(6*20)] <- 20
n <- 10
dta <- data.frame(Zeit = minute, Status = temp)
dta <- dta[rep(seq_len(nrow(dta)), n), ]
# Scale everything
maxs <- apply(dta, 2, max) 
mins <- apply(dta, 2, min)

nnInput <- data.frame(Zeit = dta$Zeit, Status = dta$Status)
nnInput <- as.data.frame(scale(nnInput, center = mins, scale = maxs - mins))
trainingData <- nnInput[seq(1, nrow(nnInput), 2), ]
testData     <- nnInput[seq(2, nrow(nnInput), 2), ]

# MODEL ---------------------
model <- as.formula("Status ~ Zeit")
net <- neuralnet::neuralnet(model, 
                            trainingData, 
                            hidden = 2, 
                            threshold = 0.01,
                            linear.output = TRUE,
                            lifesign = "full",
                            stepmax = 100000,
                            rep = 1)

net.results <- neuralnet::compute(net, testData$Zeit)

results <- net.results$net.result * (maxs["Status"] - mins["Status"]) + mins["Status"]
testData <- as.data.frame(t(t(testData) * (maxs - mins) + mins))

cleanOutput <- data.frame(Actual = testData$Status, 
                          Prediction = results, 
                          diff = abs(results - testData$Status))

summary(cleanOutput)

plot(cleanOutput$Actual[1:144], main = "Zeittabelle", xlab = paste("Min. seit 0:00 *", n), ylab = "Temperatur")
lines(cleanOutput$Prediction[1:144], col = "red", lwd = 3)

基本上 - 初始化非常重要。如果您不随机初始化它，那么您可能会使您的网络根本无法工作（例如，通过将所有权重设置为0）。也证明了对于sigmoid http://machinelearning.wustl.edu/mlpapers/paper_files/AISTATS2010_GlorotB10.pdf and relu http://arxiv.org/pdf/1502.01852v1.pdf某种类型的激活可能有助于训练您的网络。

但就你而言 - 我认为差异主要是由你的问题的复杂性造成的。如果模型的复杂性似乎适合您问题的复杂性，那么效果会很好。其他型号可能会因以下原因而受到影响：

复杂度太小- 对于一个节点，也许你基本上无法学习正确的功能。
复杂性太大- 对于两层网络，您可能会遇到陷入局部最小值的情况。增加网络参数的数量也会增加参数空间的大小。当然，一方面你可能会得到更好的模型，另一方面，你可能会落在参数空间的这个区域，这将导致糟糕的解决方案。也许尝试具有不同初始化的相同模型 - 并且选择最佳模型可能会解决这个问题。

UPDATE:

对于较小的网络规模 - 陷入局部最小值是很常见的。根据训练网络所需的时间，您可以使用以下技术来克服这个问题：
- Dropout / 批量归一化 / 批量学习随机化：当您能够训练网络更长一点的时间时 - 您可以使用 dropout 或批量归一化的随机化属性。由于这种随机波动，您可以从较差的局部最小值（通常被认为相对较浅）移动。
- 交叉验证/多次运行：当您多次开始训练时，以最低成绩完成训练的可能性会显着降低。
关于层大小和多项式次数之间的联系 - 我认为这个问题没有明确说明。您必须指定更多详细信息，例如激活函数。我还认为可以通过经典神经网络建模的多项式和函数的性质有很大不同。在多项式中，参数值的微小变化通常会导致比神经网络情况下更大的差异。通常，神经网络的导数是有界函数，而当次数大于 2 时，多项式导数是无界的。由于这个事实，我认为 - 寻找多项式次数和隐藏层大小之间的依赖关系可能是不值得认真考虑。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

了解随机起始权重对神经网络性能的影响的相关文章

在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
美人鱼图：调整图表周围的空白

我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图在 HTML PDF 输出中图表上方和下方有大量空白请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
根据 row_number() 过滤 data.frame

更新自从提出这个问题以来 dplyr 已经更新现在按照 OP 的要求执行我正在尝试获取第二行到第七行data frame using dplyr 我正在这样做 require dplyr df lt data frame id 1 1
RStudio 不会通过 rPython 调用加载所有 Python 模块

我从 Bash 和 RStudio 中运行相同的脚本时出现一些意外行为请考虑以下事项我有一个文件夹 rpython 包含两个脚本 test1 R library rPython setwd rpython python load tes
修改linux下的路径

虽然我认为我已经接近 Linux 专业人士但显然我仍然是一个初学者当我登录服务器时我需要使用最新版本的R 统计软件 R 安装在 2 个地方当我运行以下命令时 which R I get usr bin R 进而 R version
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
如何从数据框中删除少于 5 个观察值的个体 [重复]

这个问题在这里已经有答案了为了澄清这个问题我将简要描述数据中的每一行data frame是一个观察值列代表与该观察值相关的变量包括观察到什么个体观察时间观察地点等我想排除过滤观察值少于 5 个的个体换句话说如果 in
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个

随机推荐

XMLSerializer.Serialize 上的 .NET OutOfMemoryException

我有一个网站每当它到达我的代码中的以下位置时就会抛出 OutOfMemoryException XmlSerializer xs new XmlSerializer t xoverrides 看到只有在网络服务器上时才会发生这种情况我
使用 Thrift 通过共享内存进行 IPC 通信

我找不到关于如何使用 apache thrift 通过共享内存进行 ipc 通信的足够示例我的目标是在 thrift 的帮助下序列化现有的类然后通过共享内存发送到另一个进程在该进程中我在 thrift 的帮助下再次反序列化它现在我正
如何循环访问 IP 地址范围？

我想在 IP 地址范围上执行一组网络任务一旦范围大于 C 类网络我就无法枚举该范围内的所有主机我希望能够使用网络掩码迭代网络的所有主机255 255 240 0 From 192 168 0 100 To 192 168 10 100
LinqToExcel：Excel 列中的不同值

对于各位专家来说这可能是一件非常简单的事情但我对 C 4 和 INTEROP 并不熟悉因此我很困惑这是我的问题我有一个包含重复数据的 Excel 列我想将其修剪为仅具有唯一值数据如下所示 ColA ColB 10 Adam
角度表单验证 ng-disabled 不起作用

我正在尝试在我的博客文章表单中使用角度表单验证更具体地说是禁用 ng 的表单由于某些原因我无法弄清楚提交按钮没有被禁用除非所有三个输入字段都有效否则它应该被禁用谢谢您的帮助这是我的博客模板 div div class cont
如何在 Google 电子表格中插入列？

我想将新数据添加到工作表的开头开头所以我必须在工作表中添加一个新的 A1 列但我找不到任何 PHP 的 API 示例现在我用这个附加数据 body new Google Service Sheets ValueRange value
如果未使用 scp 命令指定目标路径，则文件位置

要将文件夹从本地计算机复制到我使用的服务器 scp r local folder user server path 现在我忘了第一次指定目标路径 scp r local folder user server 现在有人知道该文件夹是否已被复制
如何在视频标签中播放AVI文件？

我想知道是否可以让浏览器在一个文件中播放 AVI 文件video tag 我在网上找到的所有谈论它的内容都集中在 MP4 和 Ogg 格式但没有人谈论 AVI 格式我发现的唯一解决方案是放弃video标记并使视频可以使用 JW Play
Lua 如何创建可用于变量的自定义函数？

对于像 io close 这样的方法你可以像这样使用它 file close 有没有办法创建一个像这样工作的自定义函数您可以在变量上调用它对我来说我尝试使用它通过使用 string find 查找空格来将参数与文本文件分开所以在文
如何在 Node.js 中进行 Base64 编码？

Node js 是否有内置 Base64 编码我问这个的原因是final from crypto只能输出十六进制二进制或ASCII数据例如 var cipher crypto createCipheriv des ede3 cbc e
对于某些版本的 PHP，“未指定输入文件”

我安装了多个版本的 PHP 我写的基本上它是一个 ApacheLounge 安装在 Windows 10 上通过 FastCGI 与 PHP 进行通信这曾经让我在不同的虚拟主机上同时运行这些 PHP 版本 Apache 通过 Fas
如何可视化来自谷歌协议缓冲区的数据？

我想使用谷歌协议缓冲区存储数据另一种序列化格式也可以然后有一个用户界面来浏览该数据是否有 C 框架 API 可以让我做到这一点例如它可以使用protobuf的反射接口然后将数据填充到Qt的QTableView 或从其他工具包中
从 C 中的 long 中提取单个数字

我正在为我的 C 课程第一门编程课程做作业作业的一部分是编写代码让用户输入一个最多9位数的数字程序需要判断这个数字是递增真递增递减真递减增减实减实增不减不增共7个选项由于这是我们的第一个作业我们不允许使用课堂上
与 Jenkins 工作流程/管道并行运行阶段

请注意问题是基于旧的现在称为脚本化管道格式当使用声明式管道时并行块可以嵌套在阶段块内请参阅声明式管道 1 2 的并行阶段 https jenkins io blog 2017 09 25 declarative 1 我想知
Android 中卡片视图内带有三个点的小部件的名称是什么？

带有三个点的小部件是什么如何将其添加到我的应用程序中这根本不是一个小部件它是一个ImageButton 无边框风格使用包含一个的溢出图标PopupMenu 如需文档教程访问http developer android com gui
ASP.NET-Core 2.0 在应用程序启动后添加/删除路由

我需要添加删除通过 IApplicaitonBuilder 在 Startup 类的 Configure 方法期间注册的自定义路由启动后我在 UseMvc 命令中调用 MapRoute 方法将一堆自定义路由注册到我的控制器这些路由
ListBox不显示绑定数据

在我的 Xaml 中我有这个
将 Bootstrap 导航栏中的元素居中

无论我尝试什么我都无法将 Bootstrap 导航栏中的某些内容居中有什么解决方案吗我尝试添加一个div 使用margin 0 auto or margin right auto margin left auto used cente
opencv中的矩阵类型转换

我正在尝试使用滤波器对图像进行卷积并借助 opencv 中的 filter2D 函数将其存储到 CV 64F 类型的矩阵中但目标矩阵的类型发生了变化我尝试借助 allocateTo 0r ConvertTo 函数将其更改回 CV 64
了解随机起始权重对神经网络性能的影响

使用 R 和包neuralnet 我尝试对数据进行建模如下所示这些是几天内以 10 分钟为间隔的温度读数上面是 2 天的截图使用下面的代码我将神经网络拟合到数据可能有更简单的方法来对这些精确数据进行建模但将来数据可能看起来完全

了解随机起始权重对神经网络性能的影响

了解随机起始权重对神经网络性能的影响 的相关文章

随机推荐

热门标签

了解随机起始权重对神经网络性能的影响的相关文章