TensorFlow - 如何在忽略零权重的情况下计算梯度？

2024-01-13

我想通过将一些权重设置为 0.0（每层中的特定权重，以此处讨论不重要的方式选择）来实现剪枝，以（1）在推理过程中忽略它们，（2）在训练过程中忽略它们。

我知道我可以在推理过程中忽略它们，方法是对每一层应用一个掩码，其中 1 位于我想要保留的权重索引处，否则为零。

然而，在训练过程中，我希望忽略的权重继续被忽略。也就是说，我希望它们（1）不更新并且（2）不影响其余梯度的计算。

我可以通过在应用渐变之前屏蔽渐变来做到（1）。但我做不到（2）。

我尝试过这样的事情：

# Create an optimizer.
opt = GradientDescentOptimizer(learning_rate=0.1)

# Compute the gradients for a list of variables.
# This returns a list of tuples, each tuple containing gradients and
# the corresponding variable
[(var, grad)] = opt.compute_gradients(loss)

# Ask the optimizer to apply the capped gradients.
train_op = optimizer.apply_gradients([(grad * mask, var)])

但这并不能达到我的目的，因为optimizer.compute_gradients(loss)会计算损失基于所有权重，包括零权重。换句话说，grad将具有一些对应于权重为零的索引的梯度。应用掩模会“浪费”这些本应用于更新非零权重的梯度。

我希望它根据非零权重计算损失。

有任何想法吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Optimization

deeplearning

TensorFlow - 如何在忽略零权重的情况下计算梯度？的相关文章

如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
gcc 与 clang：符号剥离

gcc 和 AMD Open64 opencc 都有一个 s选项剥离符号表和重定位信息到目前为止我还没能在 Clang LLVM 中找到相同的选项它存在吗您可以使用stripbinutils 中的实用程序实际上 llvm ld 有
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页

随机推荐

通过插件覆盖 Visual Studio 语法突出显示？

这与我之前问过这个问题 https stackoverflow com questions 807404 displaying code sections with a different background color关于语法突出显示用
是否可以获得所有活动会话的列表？

当处于 Grails 操作中时我可以使用以下命令访问 HTTPSessionsession 是否还可以获得所有活动会话的列表这是评论中你的问题的答案我能够在 2 2 4 上使用它没有任何问题请务必阅读此内容blog http bu
AngularJS / 如何防止 IE 触发自动输入验证？

我有一些带有一些表格的页面每个表单都包含一些字段约束例如required和更多我只想在用户与验证错误交互时显示错误 UX gt 是确实只要领域 pristine意味着没有触摸不应该显示任何错误我设法用很多浏览器来实现这个要求
C/C++ 是一种语言还是两种语言？

C C 是一种语言还是两种语言我听说 C 就是带有类的 C 是对的吗 C http en wikipedia org wiki C 1982 1983 年与 C 分道扬镳这在计算机时代已经是很长一段时间了但是有许多与 C 兼容的 C
如何将目录结构导入 SVN，同时保持文件和文件夹修改日期相同？

我有一个大型源代码树 gt 2 GB WINCE 构建树我想开始使用 Subversion 进行管理到目前为止版本控制是通过保留树的多个副本并使用 Beyond Compare 来查找差异来管理的我发现使用 Subversion
如何在博客上创建或上传纯文本文件（如这两个 URL）？

如何在博客上创建或上传纯文本文件如这两个 URL crimlaw blogspot com Resume txt http crimlaw blogspot com Resume txt and crimlaw blogspot com
错误：光标'对象没有属性'_last_execulated

我有这个光标 cursor execute SELECT price FROM Items WHERE itemID SELECT item id FROM Purchases WHERE purchaseID d AND customer
如何以编程方式创建布局文件

我想知道是否可以动态创建一个 XML 布局文件来显示给用户这个想法是能够从中央服务器检索布局文件该文件可以显示这个动态的服务器驱动的 GUI XML 布局文件被打包为二进制文件并且膨胀也从二进制文件发生我不相信任意 XML 都可以
单击选项卡时返回 UINavigationController 堆栈的顶部？

我有一个UITabBarController有 4 个选项卡的界面每个选项卡都有一个UINavigationController 我怎样才能回到最上面UIViewController每一个UINavigationController每当按
搜索结果使用reactjs突出显示结果

我试图获得像 YouTube 这样的搜索结果只是尝试但我遇到了一些问题我已经在codesandbox中制作了工作应用程序here https codesandbox io s react codesandbox kyd4g 我有一个搜
DataBinding/WPF C# 的通用可观察字典类

我正在尝试在 C 中为 WPF DataBinding 创建一个可观察字典类我在这里找到了安迪的一个很好的例子 WPF 中字典的两种方式数据绑定 https stackoverflow com questions 800130 two w
如何使用 jQuery UI 日历/日期选择器显示周而不是日？

在过去的几个月里我一直在使用 jQuery UI 日历日期选择器并取得了巨大的成功我收到了一项新要求允许选择一周周日至周六而不是一天以前有人完成过这个吗按周而不是按天突出显示在文本框标签中显示开始日期和结束日期而不是单
在角度反应形式验证器中使用 google-libphonenumber

这是使用该库的基本用例我需要验证该号码是否有效我用的是有角度的反应形式 https angular io guide reactive forms 自定义验证器 https angular io guide form validatio
numpy loadtxt 跳过第一行

当我尝试使用 numpy 的 loadtxt 函数从 CSV 文件导入数据时遇到一个小问题这是我拥有的数据文件类型的示例将其命名为 datafile1 csv Comment 1 Comment 2 x y z 1 2 3 4 5 6
将异常类型添加到位框架已知异常

根据文档位框架中有一些已知的异常类型 https docs bit framework com docs bit server side web api html exceptions https docs bit framework c
修复 WooCommerce 中购物车最大优惠券折扣百分比

我在 woocommerce 中有一个优惠券代码 XYZ25 其中包含 25 的折扣最大折扣为 250 卢比如果用户应用优惠券代码 XYZ 25 获得 25 的折扣我如何限制用户获得不超过 250 卢比的折扣自 Woocommerc
ajax给出空白响应

我有一个 xml 内容存储在该位置 http localhost 8080 cleo primer rest elements search uid 1 query facebook
如何在 Eclipse RCP 中实现内容辅助的文档弹出窗口

我已经实现了自己的编辑器并为其添加了代码完成功能我的内容助理在源查看器配置中注册如下所示 public IContentAssistant getContentAssistant ISourceViewer sourceViewer i
谷歌云数据实验室和谷歌云人工智能平台笔记本有什么区别？

我正在研究建立端到端机器学习管道的最佳方法并评估数据探索组件选项我试图找出谷歌云数据实验室和谷歌云人工智能平台笔记本之间的区别它们似乎都提供类似的功能因此不确定它们为何存在或者其中一个是否是另一个的新迭代如果它们不同其中一种相
TensorFlow - 如何在忽略零权重的情况下计算梯度？

我想通过将一些权重设置为 0 0 每层中的特定权重以此处讨论不重要的方式选择来实现剪枝以 1 在推理过程中忽略它们 2 在训练过程中忽略它们我知道我可以在推理过程中忽略它们方法是对每一层应用一个掩码其中 1 位于我想要保留的权重

TensorFlow - 如何在忽略零权重的情况下计算梯度？

TensorFlow - 如何在忽略零权重的情况下计算梯度？ 的相关文章

随机推荐

热门标签

TensorFlow - 如何在忽略零权重的情况下计算梯度？的相关文章