从上三角初始化对称 Theano dmatrix

2024-04-26

我正在尝试拟合一个部分由对称矩阵参数化的 Theano 模型A。为了加强对称性A，我希望能够构建A通过仅传入上三角形中的值。

等效的 numpy 代码可能如下所示：

import numpy as np

def make_symmetric(p, n):
    A = np.empty((n, n), P.dtype)
    A[np.triu_indices(n)] = p
    A.T[np.triu_indices(n)] = p

# output matrix will be (n, n)
n = 4

# parameter vector
P = np.arange(n * (n + 1) / 2)

print make_symmetric(P, n)
# [[ 0.  1.  2.  3.]
#  [ 1.  4.  5.  6.]
#  [ 2.  5.  7.  8.]
#  [ 3.  6.  8.  9.]]

然而，由于符号张量变量不支持项目分配，我正在努力寻找一种在 Theano 中执行此操作的方法。

我能找到的最接近的是theano.tensor.diag，这允许我从它的对角线构造一个符号矩阵：

import theano
from theano import tensor as te

P = te.dvector('P')
D = te.diag(P)
get_D = theano.function([P], D)

print get_D(np.arange(1, 5))
# [[ 1.  0.  0.  0.]
#  [ 0.  2.  0.  0.]
#  [ 0.  0.  3.  0.]
#  [ 0.  0.  0.  4.]]

虽然还有一个theano.tensor.triu函数，这不能用于从上三角构造矩阵，而是返回下三角元素为零的数组的副本。

有什么方法可以从上三角构造 Theano 符号矩阵吗？

你可以使用theano.tensor.triu并将结果与其转置相加，然后减去对角线。

复制+粘贴代码：

import numpy as np
import theano
import theano.tensor as T
theano.config.floatX = 'float32'

mat = T.fmatrix()
sym1 = T.triu(mat) + T.triu(mat).T
diag = T.diag(T.diagonal(mat))
sym2 = sym1 - diag

f_sym1 = theano.function([mat], sym1)
f_sym2 = theano.function([mat], sym2)

m = np.arange(9).reshape(3, 3).astype(np.float32)

print m
# [[ 0.  1.  2.]
#  [ 3.  4.  5.]
#  [ 6.  7.  8.]]
print f_sym1(m)
# [[  0.   1.   2.]
#  [  1.   8.   5.]
#  [  2.   5.  16.]]
print f_sym2(m)
# [[ 0.  1.  2.]
#  [ 1.  4.  5.]
#  [ 2.  5.  8.]]

这有帮助吗？这种方法需要传递一个完整的矩阵，但会忽略对角线下方的所有内容并使用上三角形进行对称化。

我们还可以看一下这个函数的导数。为了不处理多维输出，我们可以例如查看矩阵项之和的梯度

sum_grad = T.grad(cost=sym2.sum(), wrt=mat)
f_sum_grad = theano.function([mat], sum_grad)

print f_sum_grad(m)
# [[ 1.  2.  2.]
#  [ 0.  1.  2.]
#  [ 0.  0.  1.]]

这反映了这样一个事实，即上三角条目的总和是双倍的。

更新：您可以进行正常的索引：

n = 4
num_triu_entries = n * (n + 1) / 2

triu_index_matrix = np.zeros([n, n], dtype=int)
triu_index_matrix[np.triu_indices(n)] = np.arange(num_triu_entries)
triu_index_matrix[np.triu_indices(n)[::-1]] = np.arange(num_triu_entries)

triu_vec = T.fvector()
triu_mat = triu_vec[triu_index_matrix]

f_triu_mat = theano.function([triu_vec], triu_mat)

print f_triu_mat(np.arange(1, num_triu_entries + 1).astype(np.float32))

# [[  1.   2.   3.   4.]
#  [  2.   5.   6.   7.]
#  [  3.   6.   8.   9.]
#  [  4.   7.   9.  10.]]

更新：要动态地完成所有这些，一种方法是编写一个符号版本triu_index_matrix。这可以通过一些洗牌来完成aranges。但也许我过于复杂化了。

n = T.iscalar()
n_triu_entries = (n * (n + 1)) / 2
r = T.arange(n)

tmp_mat = r[np.newaxis, :] + (n_triu_entries - n - (r * (r + 1)) / 2)[::-1, np.newaxis]
triu_index_matrix = T.triu(tmp_mat) + T.triu(tmp_mat).T - T.diag(T.diagonal(tmp_mat))

triu_vec = T.fvector()
sym_matrix = triu_vec[triu_index_matrix]

f_triu_index_matrix = theano.function([n], triu_index_matrix)
f_dynamic_sym_matrix = theano.function([triu_vec, n], sym_matrix)

print f_triu_index_matrix(5)
# [[ 0  1  2  3  4]
#  [ 1  5  6  7  8]
#  [ 2  6  9 10 11]
#  [ 3  7 10 12 13]
# [ 4  8 11 13 14]]
print f_dynamic_sym_matrix(np.arange(1., 16.).astype(np.float32), 5)
# [[  1.   2.   3.   4.   5.]
#  [  2.   6.   7.   8.   9.]
#  [  3.   7.  10.  11.  12.]
#  [  4.   8.  11.  13.  14.]
#  [  5.   9.  12.  14.  15.]]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

matrix

Theano

从上三角初始化对称 Theano dmatrix 的相关文章

带有指针数组的 cython

我在 python 中有一个 numpy ndarrays 列表具有不同的长度并且需要非常快速地访问 python 中的列表我认为指针数组就可以解决问题我试过 float type t list of arrays no of ar
美丽的汤从谷歌搜索中提取href

谷歌搜索给出了以下 HTML 的第一个结果 h3 class r a href https rads stackoverflow com amzn click com 0470284889 class l vst em Quantitati
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
静态文件配置不正确

我已经在 Heroku 上部署了简单的博客应用程序它运行在Django 1 8 4 我在静态文件方面遇到了一些问题当打开我的应用程序时我看到Application Error页面所以我尝试调试它并发现当我提交到 Heroku 时它无
将打开关闭的 Google Chrome 浏览器添加到 Selenium linkedin_scraper 代码中

我正在尝试抓取一些知名人士的 LinkedIn 个人资料该代码获取一堆 LinkedIn 个人资料 URL 然后使用Selenium and scrape linkedin收集信息并将其作为 json 文件保存到文件夹中我遇到的问题是
我怎样才能在python cgi中找到上传的文件名

我制作了如下简单的网络服务器 import BaseHTTPServer os cgi import cgitb cgitb enable html
有条件填写 pandas 数据框

我有一个数据框df列中包含浮点值A 我想添加另一列B这样 B 0 A 0 for i gt 0 B i if np isnan A i then A i else Step3 B i if abs B i 1 A i B i 1 lt 0
将 matplotlib png 转换为 base64 以在 html 模板中查看

背景你好我正在尝试制作一个简单的网络应用程序按照教程计算阻尼振动方程并将结果的 png 返回到 html 页面然后将其转换为 Base64 字符串 Problem 该应用程序运行正常只是在计算结果时返回损坏的图像图标可能是因为
十六进制数的按位异或

我们如何在 Python 中对十六进制数进行异或例如我想要异或 ABCD and 12EF 答案应该是 B922 我使用了下面的代码但它给出了错误的结果 xor two strings of different lengths def
在 keras 中使用自定义张量流操作

我在张量流中有一个脚本其中包含自定义张量流操作我想将代码移植到 keras 但我不确定如何在 keras 代码中调用自定义操作我想在 keras 中使用tensorflow 所以到目前为止我发现的教程描述了与我想要的相反的内容 htt
Python 字典 - 在 2 个字符的字符串中查找第二个字符，该字符产生最小值

我想提交密钥的第一部分并返回该密钥的剩余部分以最小化值并从第一部分开始例如 d ab 100 ac 200 ad 500 如果我要进去 a I would like to return b min d s s for s in d i
Pandas Pivot_Table ：非数字值的行计算百分比

这是我在数据框 df 中的数据 Document Name Time SPS2315511 A 1 HOUR SPS2315512 B 1 2 HOUR SPS2315513 C 2 3 HOUR SPS2315514 C 1 HOUR S
如何使用python读取最后一行的特定位置

我有一个太大的 txt 文件并且有几行类似的行如下所示字1 字2 字3 字4 553 75 我对位置 4 值感兴趣即最后一行 553 75 我的文件文本 word1 word2 word3 word4 553 20 word1 w
Floyd-Warshall 算法：获取最短路径

假设一个图由一个表示n x n维数邻接矩阵我知道如何获得所有对的最短路径矩阵但我想知道有没有办法追踪所有最短路径 Blow是python代码实现 v len graph for k in range 0 v for i in range
在Python中计算结构体的CRC

我有以下结构来自 C 中的 NRPE 守护程序代码 typedef struct packet struct int16 t packet version int16 t packet type uint32 t crc32 value
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py
django 组合对两个不同基本模型的查询

我有两个不同的查询集我想将两个查询集合并 q1 tbl nt 123 objects values list id value geometry filter restriction height exclude condition id
Jinja2中获取请求参数

如何检索请求参数a在 Jinja2 模板中 http foo bar a 1 我这个答案有点晚了但其他解决方案并没有真正考虑到您对 Flask 的使用事实上您将 Flask 与 Jinja2 一起使用这使得您的情况与其他框架有点不同
如何使用 Python 将我的 GoPro Hero 4 相机直播连接到 openCV？

我在尝试从我的新 GoPro Hero 4 相机捕获实时流并使用 openCV 对其进行一些图像处理时遇到麻烦这是我的试用创建的窗口上没有显示任何内容 import cv2 import argparse import time imp
Selenium Python 使用代理运行浏览器[重复]

这个问题在这里已经有答案了我正在尝试编写一个非常简单的脚本该脚本从 txt 文件获取代理不需要身份验证并用它打开浏览器然后沿着代理列表循环此操作一定次数我确实知道如何打开 txt 文件并使用它我的主要问题是让代理正常工作我见

随机推荐

使用会话 ID 将消息添加到 IAsyncCollector 主题输出

目前是否可以将消息推送到 Azure 函数的 IAsyncCollector 主题输出并设置会话 ID 我的主题实际上是关于 FIFO 排序的所以我们必须设置会话因此我们设想只设置一个 Guid 作为唯一的会话 ID 我知道如何通过此
显示MJPEG流的跨浏览器解决方案

有没有一种轻量级免费且可靠的方式在跨浏览器环境中显示 MJPEG 我正在尝试显示来自轴2120 http www axis com techsup cam servers cam 2120 index htm我正在开发的网站上有 IP 摄
如何在 Guice 中定义方法拦截器的顺序？

有时需要知道 Guice 中拦截方法调用的方法拦截器的顺序一个简单的示例场景是使用 guice persist 提供的 Transactional 方法拦截器和自定义 Retry 方法拦截器重试拦截器必须在事务拦截器外部运行以确保重试
操作 Symfony Intl 提供的国家列表和表单选择类型

抛开政治不谈我需要提供Kosovo作为选择国家时的形式选择使用 Symfony 的内置表单选择类型执行此操作的最优雅的方法是什么country 同时还提供翻译Kosovo name 这是我到目前为止所做的事情它有效但我担心这可能有点
JPA 2 - 外键仅包含复合主键中的一个字段？

我在 JPA 2 Hibernate 中获取复合主键和外键时遇到问题我正在尝试创建一个包含国家和省份的简单场景国家实体 Entity Table name country public class Country extends Dom
版本变更jquery错误

大家好我使用 asp 构建了一个 Web 应用程序其中包含一点来自 bootstap 的 jquery boorstrap dropdown js 对于其他一些比我开发的项目版本更低的项目我将版本从4更改为3 5 现在我收到错误 Mi
错误：无法计算表达式，因为代码已优化

我的 asp net 应用程序中出现错误内容如下无法计算表达式因为代码已优化或本机框架位于调用堆栈的顶部 protected void btnCustomerProfile Click object sender EventArgs
“: ${foo=value}”中冒号运算符的解释

我理解 bash 中的冒号运算符的作用类似于a null http devmanual gentoo org tools reference bash index html multiple selection 我知道它用在参数扩展 htt
Android (ActionBarSherlock) 有什么方法可以在纵向和横向上保持相同的 ActionBar 高度吗？

最近几天我一直在使用 ActionBar 和 ActionBarSherlock 在 ActionBar 中填写一些信息时遇到一些问题当应用程序以纵向模式运行时 ActionBar看起来不错并且可以显示所有数据例如但是当我将应用程序
获取 Android 音乐播放器的专辑封面

我想知道如何在音乐播放器中返回专辑封面的图像的代码函数你能解释一下我应该传递哪些参数吗我可以将文件路径传递给该函数 imported required libraries public class SongsManager SDCar
未定义拖放区

我对 JavaScript 还很陌生这让我发疯我想使用 Dropzone js 因此我从以下位置下载了文件 dropzone jshere https raw githubusercontent com enyo dropzone ma
使用图像的java自定义形状框架[重复]

这个问题在这里已经有答案了我喜欢创建一个像这个图像一样的java jframe 我已经用不同的形状如三角形圆形多边形和一些疯狂的形状创建了jframe 但是问题是太难 99 不可能创建像这个图像的形状所以我怎样才能制作一个像这
在我的 flutter 应用程序中单击容器时更改容器的颜色

我通过 API 获取了一些兴趣数据并向他们展示了使用未来的构建器作为容器我想在单击容器时更改容器的背景颜色这是我所做的当我单击一个容器时它会更改所有容器的背景颜色我在容器的颜色中添加了一个 if 条件来检查它是否被单击颜色
表达式类型不明确，没有更多上下文 swift 4.0

我正在实施pod Socket IO Client Swift but in SocketEngine swift文件我收到此错误 private func handleBase64 message String binary in bas
Proguard 混淆不起作用

我试图混淆我的包名称包括我使用的库之一我在我的 gradle 文件中使用这个构建配置 buildTypes debug versionNameSuffix Development debuggable true runProguard
使用 openGL、SOIL 加载图像

我尝试了很多使用 SOIL 在 openGL 中加载和显示图像的示例运行下面的源代码时它仅显示一个没有图像的白色四边形我尝试打开一个名为 foto 的图像我将图像文件放在程序的文件夹中 bool keyStates new bool
Delphi：设置 TByteDynArray 长度的问题

问题已结束答案已接受替换为Delphi 7 访问冲突 TByteDynArray 问题 https stackoverflow com questions 3157732 delphi 7 access violation tbyted
删除一个单词及其后面的所有内容

假设我有一个字符串 C Program Files x86 Steam steam exe lets go 342131 some random text 我想从该字符串中删除 steam exe 以及之后的所有内容所以我修剪过的字符串看
如何使用 Square OKHTTP 固定证书？

我想我需要创建一个新的 SSL 套接字工厂另外我不想使用全局 SSL 上下文 https github com square okhttp issues 184 https github com square okhttp issues
从上三角初始化对称 Theano dmatrix

我正在尝试拟合一个部分由对称矩阵参数化的 Theano 模型A 为了加强对称性A 我希望能够构建A通过仅传入上三角形中的值等效的 numpy 代码可能如下所示 import numpy as np def make symmetric p

从上三角初始化对称 Theano dmatrix

从上三角初始化对称 Theano dmatrix 的相关文章

随机推荐

热门标签