Tensorflow：如何在语义分割过程中忽略特定标签？

2024-03-28

我正在使用张量流进行语义分割。在计算像素损失时，如何告诉张量流忽略特定标签？

我读了在这篇文章中 https://stackoverflow.com/questions/39091432/tensorflow-softmax-ignore-negative-labels-just-like-caffe/39113607对于图像分类，可以将标签设置为-1并且它会被忽略。如果这是真的，给定标签张量，我如何修改我的标签，以便将某些值更改为-1?

在 Matlab 中它会是这样的：

ignore_label = 255
myLabelTensor(myLabelTensor == ignore_label) = -1

但我不知道在TF中如何做到这一点？

一些背景信息：
这是标签的加载方式：

label_contents = tf.read_file(input_queue[1])
label = tf.image.decode_png(label_contents, channels=1)

这是目前计算损失的方式：

raw_output = net.layers['fc1_voc12']
prediction = tf.reshape(raw_output, [-1, n_classes])
label_proc = prepare_label(label_batch, tf.pack(raw_output.get_shape()[1:3]),n_classes)
gt = tf.reshape(label_proc, [-1, n_classes])

# Pixel-wise softmax loss.
loss = tf.nn.softmax_cross_entropy_with_logits(prediction, gt)
reduced_loss = tf.reduce_mean(loss)

with

def prepare_label(input_batch, new_size, n_classes):
    """Resize masks and perform one-hot encoding.

    Args:
      input_batch: input tensor of shape [batch_size H W 1].
      new_size: a tensor with new height and width.

    Returns:
      Outputs a tensor of shape [batch_size h w 21]
      with last dimension comprised of 0's and 1's only.
    """
    with tf.name_scope('label_encode'):
        input_batch = tf.image.resize_nearest_neighbor(input_batch, new_size) # as labels are integer numbers, need to use NN interp.
        input_batch = tf.squeeze(input_batch, squeeze_dims=[3]) # reducing the channel dimension.
        input_batch = tf.one_hot(input_batch, depth=n_classes)
    return input_batch

我正在使用张量流-deeplab-resnet 模型 https://github.com/DrSleep/tensorflow-deeplab-resnet它将 Caffe 中实现的 Resnet 模型转移到张量流中，使用caffe-tensorflow https://github.com/ethereon/caffe-tensorflow.

根据文档，tf.nn.softmax_cross_entropy_with_logits https://www.tensorflow.org/api_docs/python/nn/classification#softmax_cross_entropy_with_logits必须使用有效的概率分布来调用labels，否则计算将不正确，并使用tf.nn.sparse_softmax_cross_entropy_with_logits https://www.tensorflow.org/api_docs/python/nn/classification#sparse_softmax_cross_entropy_with_logits（这在您的情况下可能更方便）带有负标签将导致错误或返回 NaN 值。我不会依赖它来忽略一些标签。

我要做的是将被忽略类的 logits 替换为那些像素中的无穷大，其中正确的类是被忽略的类，因此它们不会对损失产生任何影响：

ignore_label = ...
# Make zeros everywhere except for the ignored label
input_batch_ignored = tf.concat(input_batch.ndims - 1,
    [tf.zeros_like(input_batch[:, :, :, :ignore_label]),
     tf.expand_dims(input_batch[:, :, :, ignore_label], -1),
     tf.zeros_like(input_batch[:, :, :, ignore_label + 1:])])
# Make corresponding logits "infinity" (a big enough number)
predictions_fix = tf.select(input_batch_ignored > 0,
    1e30 * tf.ones_like(predictions), predictions)
# Compute loss with fixed logits
loss = tf.nn.softmax_cross_entropy_with_logits(prediction, gt)

唯一的问题是，您正在考虑被忽略类的像素总是被正确预测，这意味着包含大量此类像素的图像的损失将人为地变小。根据具体情况，这可能很重要，也可能不重要，但如果你想真正准确，你必须根据未忽略的像素数量对每个图像的损失进行加权，而不是仅仅取平均值。

# Count relevant pixels on each image
input_batch_relevant = 1 - input_batch_ignored
input_batch_weight = tf.reduce_sum(input_batch_relevant, [1, 2, 3])
# Compute relative weights
input_batch_weight = input_batch_weight / tf.reduce_sum(input_batch_weight)
# Compute reduced loss according to weights
reduced_loss = tf.reduce_sum(loss * input_batch_weight)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Tensorflow：如何在语义分割过程中忽略特定标签？的相关文章

Google Colab：为什么 CPU 比 TPU 快？

我正在使用 Google colabTPU训练一个简单的Keras模型删除分布式strategy并在CPU比TPU 这怎么可能 import timeit import os import tensorflow as tf from sk
如何在 Tensorflow 中计算 R^2

我正在尝试在 Tensorflow 中进行回归我不确定我计算 R 2 是否正确因为 Tensorflow 给出的答案与sklearn metrics r2 score有人可以看看我下面的代码让我知道我是否正确地实现了图中的方程谢谢
3D 卷积神经网络输入形状

我在使用 3D CNN 提供数据时遇到问题Keras http keras io和 Python 对 3D 形状进行分类我有一个文件夹其中包含一些 JSON 格式的模型我将这些模型读入 Numpy 数组模型为 25 25 25 表示
使用 keras.utils.Sequence 多处理和数据库 - 何时连接？

我正在使用 Keras 和 Tensorflow 后端训练神经网络数据集不适合 RAM 因此我将其存储在 Mongo 数据库中并使用子类检索批次keras utils Sequence 一切正常如果我跑的话model fit gene
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
为什么在线预测失败并显示“无法从 feed 中获取元素作为字节”？

在线预测失败并显示无法从源中获取字节形式的元素这是什么意思以及如何解决它我使用以下代码生成预测 request data examples pickup longitude 73 885262 pickup latitude 40
如何查找冻结模型的输入和输出节点

我想使用张量流optimize for inference py来自模型动物园的冷冻模型的脚本 ssd mobilenet v1 coco 如何查找确定模型的输入名称和输出名称雇用张量板生成的图的版本 https i stack img
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
TensorFlow：有没有办法将冻结图转换为检查点模型？

可以将检查点模型转换为冻结图 ckpt 文件转换为 pb 文件但是是否有反向方法将 pb 文件再次转换为检查点文件我想它需要将常量转换回变量有没有办法将正确的常量识别为变量并将它们恢复回检查点模型目前支持将变量转换为常量 http
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl

随机推荐

种子中的 DHT

我正在编写一个 P2P 实现我希望将其去中心化然而我在掌握如何做时遇到了一些困难DHT https en wikipedia org wiki Distributed hash table在像 BitTorrent 这样的协议中是有效的
帮助正确计算atan2

我需要计算线之间的角度我需要计算atan 所以我正在使用这样的代码 static inline CGFloat angleBetweenLinesInRadians2 CGPoint line1Start CGPoint line1End
python中“追加”和“+”有什么区别？ [复制]

这个问题在这里已经有答案了我不知道有什么区别f and g 功能中f 每当调用函数时列表 L 就会累积但在功能上g 它不是 def f a L L append 2 print L def g a L L L 2 print L pr
SQL Server 2008中的递归同表查询

我在 SQL Server 2008 数据库中有下表 Id Name ParentFolder 1 Europe NULL 2 Asia NULL 3 Germany 1 4 UK 1 5 China 2 6 India 2 7 Scotl
echo 函数跳转到 Div 之外

我创建了一个用于 gettext 翻译的函数该函数位于头文件中 function ex text echo gettext text 当我使用函数 ex 时它会翻译该函数中的任何文本效果很好尽管当我在另一个内部有 div 的函数中使用
使用 Apache Lucene 对 MySQL 数据库建立索引，并保持它们同步

当MySQL中添加一个新项目时它也必须被Lucene索引当现有项目从 MySQL 中删除时它也必须从 Lucene 的索引中删除这个想法是编写一个脚本通过调度程序例如 CRON 任务每 x 分钟调用一次这是保持 MySQL
简单的 Perl websocket 客户端

我正在尝试用 Perl 编写一个简单的 websocket 客户端 use Protocol WebSocket Client my client Protocol WebSocket gt new url gt ws myserver p
使用多核的 Numpy np.einsum 数组乘法

我用MKL编译了numpy 1 6 2和scipy 希望有更好的性能目前我有一个严重依赖 np einsum 的代码并且我被告知 einsum 不适用于 MKL 因为几乎没有矢量化所以我想用 np dot 和切片重新编写一些代码只是
预训练 Transformer 模型的配置更改

我正在尝试为重整变压器实现一个分类头分类头工作正常但是当我尝试更改配置参数之一 config axis pos shape 即模型的序列长度参数时它会抛出错误 Reformer embeddings position embeddin
IL 使用 Reflection.Emit 调用带有 params object[] 参数的方法

我正在编写一个需要稍后类型构建的库库使用平台 Net core 2 0 我使用 Reflection Emit 生成的某些类型存在问题 public class GeneratedA A IA public void DoInterfac
为什么 git rebase 在我未修改的文件中显示冲突？

假设我在本地仓库其分支是my name branch A 当我做git rebase
XML::LibXML 文本节点父节点的概念

这里似乎有些奇怪在下面的示例中我通过 XPath 查询访问文本节点 book isbn text The text 需要强制XML LibXML允许我使用XML LibXML Text方法不过要到达父节点我必须调用parentNo
NSLocationWhenInUseUsageDescription 的 Xamarin.iOS 本地化

有没有办法本地化NSLocationWhenInUseUsageDescription in Info plist在 Xamarin 工作室中或者是否有可能将完整的内容本地化Info plist也将是一个解决方案我尝试了以下步骤因为它
如何在 for 循环中制作按钮，并为每个按钮添加 lambda 表达式？ [复制]

这个问题在这里已经有答案了我正在尝试用 javafx 制作一个刽子手游戏因此很自然地我尝试使用 for 循环来创建每个按钮而不是创建 26 个单独的按钮我将它们放入名为 Alphabet 的 ArrayList 中并将它们添加
快速滚动 UIPageViewController 阻止视图控制器更新

我有一个 UIPageviewcontroller 里面有两个控制器当您滑动到下一个时我使用 viewController 参数来设置适当的委托但我的经验是如果你滑动得太快函数 viewControllerAfter 就无法正确更
用于加密的公钥；解密用的私钥？

我知道私钥和公钥在数学上是相关的用一个密钥加密的数据只能用另一个密钥解密我的问题是私钥总是用于加密数据而公钥总是用于解密数据或者可以反过来如果是这样您能否给出一些在其他方向使用的示例应用程序用于加密的公钥和用于解密的私钥加密
连接到 unix:/var/run/php5-fpm.sock 失败。我的设置有什么问题吗？

我在 DigitalOcean 上有一个 2GB VPS 并且在 Debian 7 下使用 NGINX php fpm 和 unix 套接字托管 WordPress 3 9 1 它一直工作得很好直到上周它开始显示 502 bad gate
根据 pandas 中的给定条件派生特征或列

我有 df 如下所示 ID Age days N 30 N 31 90 N 91 180 N 180 365 1 201 60 15 30 1 2 800 0 15 5 10 3 800 0 0 10 6 4 100 0 0 0 370 5
在 HTML5 中使用 IE 特定元标记是否合法？

我一直在尝试在标题中使用以下两行来验证 html5 文档整个文档验证得非常好但是这两行是 IE 特定的导致页面无效我的问题这些元标记有合法的 HTML5 语法吗我非常希望我的代码有效但是这些标签不能被省略根据您对服务器服务
Tensorflow：如何在语义分割过程中忽略特定标签？

我正在使用张量流进行语义分割在计算像素损失时如何告诉张量流忽略特定标签我读了在这篇文章中 https stackoverflow com questions 39091432 tensorflow softmax ignore neg

Tensorflow：如何在语义分割过程中忽略特定标签？

Tensorflow：如何在语义分割过程中忽略特定标签？ 的相关文章

随机推荐

热门标签

Tensorflow：如何在语义分割过程中忽略特定标签？的相关文章