在 Tensorflow 中实现暹罗网络

2024-01-26

我想实现一个连体卷积神经网络，其中两个图像在卷积层中共享权重，然后在通过全连接层之前进行连接。我尝试过一种实现，但它似乎是一个“黑客”解决方案。特别是，我已将张量上的操作定义为简单的 Python 函数，并且我不确定这是否允许。

这是我尝试过的代码：

images = tf.placeholder(tf.float32, shape=[None, 64 * 64])
# Convolutional layers
# ...
# ...
# Results in pool3_flat, which is the flattened output of the third convolutional layer
pool3_flat = tf.reshape(pool3, [-1, 8 * 8 * 128])

# Now, merge the image pairs, where each pair is composed of adjacent images in the batch, with a stride of 2
def merge_pairs():
  # Create a tensor to store the merged image pairs
  # The batch size is 128, therefore there will be 64 pairs (64 in the first dimension of this tensor)
  merged_pairs = tf.Variable(tf.zeros([64, 8 * 8 * 128]))
  # Split the images into 64 pairs
  pairs = tf.split(0, 64, pool3_flat)
  # For each pair, concatenate the two images across dimension 1, and set this tensor in the appropriate row of merged_pairs
  for pair_num, pair in enumerate(pairs):
      merged_pair = tf.concat(1, pair)
      merged_pairs[pair_num] = merged_pair
  return merged_pairs


# Proceed with operations on the merged_pair tensor, as if the batch size is 64
fc4 = tf.matmul(merge_pairs(), weights4)
# ...
# ...

虽然它可以编译并且运行良好，但结果并不真正符合预期。所以，我想知道是否有更好的方法来使用 TensorFlow 中的内置操作来实现 Siamese 网络？

您可以利用tf.pack https://www.tensorflow.org/versions/r0.7/api_docs/python/array_ops.html#pack and tf.解包 https://www.tensorflow.org/versions/r0.7/api_docs/python/array_ops.html#unpack，有点像：

pairs = tf.pack(tf.split(0, 64, pool3_flat))
left, right = tf.unpack(tf.transpose(pairs, perm=[1,0,2]))
merged_pairs = tf.concat(1, [left, right])

一种更简洁的方法是从一开始就将各对分开，以便您可以定义两个网络并在每个网络中使用相同的可训练变量。

你会得到类似的东西（跳过卷积层）：

image_left = tf.placeholder(tf.float32, shape=[None, 64, 64, 1])
image_right = tf.placeholder(tf.float32, shape=[None, 64, 64, 1])

pool_left = tf.nn.max_pool(image_left, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
pool_right = tf.nn.max_pool(image_left, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

pool_flat_left = tf.reshape(pool_left, [-1, 32*32])
pool_flat_right = tf.reshape(pool_right, [-1, 32*32])

然后简单地在维度 1 中左右连接。

concat_layer = tf.concat(1, [pool_flat_left, pool_flat_right])

这样您也可以稍后改变批量大小。确保每个尺寸（左和右）使用相同的权重和偏差。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

在 Tensorflow 中实现暹罗网络的相关文章

Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
tf.gather_nd 直观上是做什么的？

你能直观地解释一下或者举更多例子吗tf gather nd用于在 Tensorflow 中索引和切片为高维张量我读了API https www tensorflow org api docs python tf gather nd 但它保
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
无法使用 Keras 中的 multi_gpu_model 后的 model.save 保存模型

升级到 Keras 2 0 9 后我一直在使用multi gpu model实用程序但我无法使用保存我的模型或最佳权重 model save path 我得到的错误是类型错误无法pickle模块对象我怀疑访问模型对象时存在一些问题
将 tf.contrib.layers.xavier_initializer() 更改为 2.0.0

我该如何改变 tf contrib layers xavier initializer tf 版本 gt 2 0 0 所有代码 W1 tf get variable W1 shape self input size h size initi
大于 2GB 的 Tensorflow 图

我正在尝试优化一个大型张量流保存模型其中包含 10MB saving model pb 和 16GB 变量我尝试冻结我的图表并进行一些进一步的转换我已按照步骤操作https medium com google cloud optimi
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
让 TensorFlow 在 ARM Mac 上使用 GPU

我已经安装了TensorFlow在 M1 上 ARM Mac 根据这些说明 https github com apple tensorflow macos issues 153 一切正常然而模型训练正在进行CPU 如何将培训切换到GPU
Tensorflow：Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
如何修复 Tensorflow 中的“ValueError：操作数无法与形状 (2592,) (4,) 一起广播”？

我目前正在设计一个 NoisyNet 层如下所示探索嘈杂的网络 https arxiv org abs 1706 10295 在 Tensorflow 中并得到如标题所示的维度误差而两个张量的维度将在行中按元素相乘filtered o
“你好，TensorFlow！”使用 C API

出于学习目的如何使用 TensorFlow C API 编写此 Python 示例 import tensorflow as tf hello tf constant hello TensorFlow sess tf Session pr
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
model.fit 在 Keras 中如何工作？

我之前的帖子或错误是这样的one https stackoverflow com questions 52261090 do the operations defined in array ops in tensorflow have gr

随机推荐

如何在 Bucardo Postgresql multi master 中处理序列

我们正在三个不同的 Postgresql 服务器上设置一个数据库将来可能会在更多服务器上目前使用 bucardo 多主组同步所有表我们不同步序列我们尝试过我们注意到当同时写入发生在不同服务器上的同一个表中时布卡多会让我们丢失数据
用户是否已经“喜欢”Facebook 帖子

我已经尝试解决这个问题有一段时间了并且慢慢意识到我拨打的电话并不是我想要的电话我目前正在获取用户新闻源并添加一个喜欢按钮但如果他们已经喜欢它则应该说不喜欢我打电话给 me likes 并获得了一些数据我通过比较新闻源中的每
如何避免单元测试中的Thread.sleep？

假设我有以下应该测试的方法 Autowired private RoutingService routingservice public void methodToBeTested Object objectToRoute initiali
WPF 图像源与 StringFormat 绑定

我是 WPF 和 MVVM 的新手本周开始尝试并尝试在运行时绑定图像资源我尝试显示的项目包含一个枚举属性该属性指示项目的类型或状态 public class TraceEvent
如何从服务器执行 GraphQL 查询

我正在使用 graphql express 创建一个端点我可以在其中执行 graphql 查询虽然我将 Sequelize 与 SQL 数据库一起使用但直接从 graphql 之外的服务器使用它感觉不对resolve功能如何从定义它
VB 2010 - 具有标签名称值的变量

我正在使用 VB 2010 Express 并且我的表单中有一个名为 lblTitle 的标签下一个代码不起作用我知道但我该如何做这样的事情呢 Dim bla As String bla lblTitle bla Text Hello
检查 Android 中的 VPN 连接是否处于活动状态？

我的非 root Android 4 4 设备上有一个第三方 VPN 应用程序并且想要编写一个后台服务来监视 VPN 连接并在 VPN 连接已断开时提醒用户有没有办法做到这一点我找不到任何使用 VPNService API 的方法感
在 Apache Camel 应用程序中，单元测试如何注入模拟端点来代替真实端点？

我正在实施一个消息翻译模式 http camel apache org message translator html使用 Apache Camel 使用来自 RESTful 端点的消息并将它们发送到 AMQP 端点封闭的应用程序基于 S
“showkeyboard”事件来自哪里？

我正在使用 PhoneGap 我需要在 Android 手机上捕获键盘正在显示事件我发现一些线程说要使用 showkeyboard 事件例如这个显示隐藏键盘在 Android PhoneGap 中无法正常工作 https stac
摆脱签名 Java Applet 安全对话框

这可能是一个荒谬的问题我有一个签名的小程序它只能在客户端的计算机文件系统上读写我可以从像 Verysign 或 Thawte 等知名机构购买数字证书来签署小程序如果我使用上述权限签署小程序我可以摆脱 Java 插件持有的这种不明确
使用 python3 中现有的超类实例初始化子类

我正在用 python 编写我自己版本的套接字类我想知道是否有办法not使用它初始化子类 init 方法而是使用初始化它套接字类的现有实例基本上我想做的是从套接字类继承并覆盖accept 方法返回我自己的类的对象而不是套接字类为
使用ansible下载大文件

我想用 ansible 下载一个大文件 10 GB 根据连接情况这需要半个小时并且经常因 unarchive 或 get url 失败如何在出现错误时恢复并取得某种进展从而理想地实现这一目标我认为没有任何方法可以在 Ansible
“useLegacyV2RuntimeActivationPolicy”在 .NET 4 配置中起什么作用？

在将使用 SlimDX 因此具有非托管代码的项目转换为 NET 4 0 时我遇到了以下错误混合模式程序集是针对运行时版本 v2 0 50727 构建的如果没有附加配置信息则无法在 4 0 运行时中加载谷歌搜索给了我解决方案即将
SQL 查询具有自定义文件扩展名的平面文件时出错

我正在寻找一种查询平面文件的方法custom直接通过 SQL 扩展文件通常使用类似的东西 SELECT FROM Text DATABASE C Flatfiles S7121070 ppis csv 它与 txt csv 和 tab 配
使用 PEG.js 解析缩进级别

我基本上有同样的问题Python 风格缩进的 PEG https stackoverflow com questions 4205442 peg for python style indentation 但我想得到更多关于这个答案 http
如何检查变量是否在 Octave 中定义？

当编写加载数据的脚本时每次等待它加载都是浪费时间如何检查变量是否已定义您可以使用existOctave 中的函数来完成这项工作它可用于检查给定名称作为变量内置函数文件或目录是否存在在您的情况下要检查变量是否存在您可以使用如
C ++在for循环中初始化2个不同的迭代器[重复]

这个问题在这里已经有答案了可能的重复我可以在 for 循环的初始化中声明不同类型的变量吗 https stackoverflow com questions 8644707 can i declare variables of diff
如何覆盖 javascript 本机对象的内置方法

假设我们有窗口对象的警报方法我想用漂亮的警报框来增强它另外我想保存现有的警报方法以便我们可以在应用程序结束后切换回来类似这样的东西但它在 Firefox 控制台中抛出错误 window prototype alert funct
pip 可以与 Visual Studio 中的 Python 工具一起使用吗？

我正在与一些同学合作构建一个 python 应用程序并希望使用 Visual Studio 智能感知的训练轮他们在 mac 和 linux 上使用 python 所以理想情况下我们的源代码控制存储库将仅包含 py我们编写的源文件以及
在 Tensorflow 中实现暹罗网络

我想实现一个连体卷积神经网络其中两个图像在卷积层中共享权重然后在通过全连接层之前进行连接我尝试过一种实现但它似乎是一个黑客解决方案特别是我已将张量上的操作定义为简单的 Python 函数并且我不确定这是否允许这是我尝试过

在 Tensorflow 中实现暹罗网络

在 Tensorflow 中实现暹罗网络 的相关文章

随机推荐

热门标签

在 Tensorflow 中实现暹罗网络的相关文章