Tensorflow 入门 - 将图像分割为子图像

2024-02-03

这是我第一次使用卷积神经网络和 Tensorflow。

我正在尝试实现一个能够extract来自数字视网膜图像的血管。我正在与公开可用的驱动数据库 http://www.isi.uu.nl/Research/Databases/DRIVE/（图像为 .tif 格式）。

由于我的图像非常大，我的想法是将它们分成大小为 28x28x1 的子图像（“1”是绿色通道，是我唯一需要的）。为了创建训练集，我从每个图像中迭代随机裁剪 28x28 批次，并在此集上训练网络。

现在，我想在数据库中的一张大图像上测试我训练过的网络（也就是说，我想将网络应用于完整的眼睛）。由于我的网络是在大小为 28x28 的子图像上进行训练的，因此想法是将眼睛分成“n”个子图像，将它们传递给网络，重新组装它们并显示结果，如图 1 所示：

Fig1 https://i.stack.imgur.com/0Na8a.jpg

我尝试使用一些功能，例如：tf.extract_image_pathces or tf.train.batch，但我想知道执行此操作的正确方法是什么。

下面是我的代码片段。我陷入困境的功能是split_image(image)

import numpy
import os
import random

from PIL import Image
import tensorflow as tf

BATCH_WIDTH = 28;
BATCH_HEIGHT = 28;

NUM_TRIALS = 10;

class Drive:
    def __init__(self,train):
        self.train = train

class Dataset:
    def __init__(self, inputs, labels):
        self.inputs = inputs
        self.labels = labels
        self.current_batch = 0

    def next_batch(self):
        batch = self.inputs[self.current_batch], self.labels[self.current_batch]
        self.current_batch = (self.current_batch + 1) % len(self.inputs)
        return batch


#counts the number of black pixel in the batch
def mostlyBlack(image):
    pixels = image.getdata()
    black_thresh = 50
    nblack = 0
    for pixel in pixels:
        if pixel < black_thresh:
            nblack += 1

    return nblack / float(len(pixels)) > 0.5

#crop the image starting from a random point
def cropImage(image, label):
    width  = image.size[0]
    height = image.size[1]
    x = random.randrange(0, width - BATCH_WIDTH)
    y = random.randrange(0, height - BATCH_HEIGHT)
    image = image.crop((x, y, x + BATCH_WIDTH, y + BATCH_HEIGHT)).split()[1]
    label = label.crop((x, y, x + BATCH_WIDTH, y + BATCH_HEIGHT)).split()[0]
    return image, label

def split_image(image):

    ksizes_ = [1, BATCH_WIDTH, BATCH_HEIGHT, 1]
    strides_ = [1, BATCH_WIDTH, BATCH_HEIGHT, 1]

    input = numpy.array(image.split()[1])
    #input = tf.reshape((input), [image.size[0], image.size[1]])

    #input = tf.train.batch([input],batch_size=1)
    split = tf.extract_image_patches(input, padding='VALID', ksizes=ksizes_, strides=strides_, rates=[1,28,28,1], name="asdk")

#creates NUM_TRIALS images from a dataset
def create_dataset(images_path, label_path):
    files = os.listdir(images_path)
    label_files = os.listdir(label_path)

    images = [];
    labels = [];
    t = 0
    while t < NUM_TRIALS:
        index = random.randrange(0, len(files))
        if files[index].endswith(".tif"):
            image_filename = images_path + files[index]
            label_filename = label_path  + label_files[index]
            image = Image.open(image_filename)
            label = Image.open(label_filename)
            image, label = cropImage(image, label)
            if not mostlyBlack(image):
                #images.append(tf.convert_to_tensor(numpy.array(image)))
                #labels.append(tf.convert_to_tensor(numpy.array(label)))
                images.append(numpy.array(image))
                labels.append(numpy.array(label))

                t+=1

    image = Image.open(images_path + files[1])
    split_image(image)

    train = Dataset(images, labels)
    return Drive(train)

您可以组合使用reshape and transpose调用将图像切割成图块而不使用循环：

def split_image(image3, tile_size):
    image_shape = tf.shape(image3)
    tile_rows = tf.reshape(image3, [image_shape[0], -1, tile_size[1], image_shape[2]])
    serial_tiles = tf.transpose(tile_rows, [1, 0, 2, 3])
    return tf.reshape(serial_tiles, [-1, tile_size[1], tile_size[0], image_shape[2]])

where image3是一个 3 维张量（例如图像），并且tile_size是一对值[H, W]指定图块的大小。输出是一个形状为的张量[B, H, W, C]。在你的情况下，调用将是：

tiles = split_image(image, [28, 28])

得到形状为的张量[B, 28, 28, 1]。您还可以通过反向执行以下操作从图块重新组合原始图像：

def unsplit_image(tiles4, image_shape):
    tile_width = tf.shape(tiles4)[1]
    serialized_tiles = tf.reshape(tiles4, [-1, image_shape[0], tile_width, image_shape[2]])
    rowwise_tiles = tf.transpose(serialized_tiles, [1, 0, 2, 3])
    return tf.reshape(rowwise_tiles, [image_shape[0], image_shape[1], image_shape[2]])

Where tiles4是形状的 4D 张量[B, H, W, C], and image_shape是原始图像的形状。在您的情况下，调用可能是：

image = unsplit_image(tiles, tf.shape(image))

请注意，这仅在图像大小可被图块大小整除时才有效。如果不是这种情况，您需要将图像填充到最接近的图块大小的倍数：

def pad_image_to_tile_multiple(image3, tile_size, padding="CONSTANT"):
    imagesize = tf.shape(image3)[0:2]
    padding_ = tf.to_int32(tf.ceil(imagesize / tile_size)) * tile_size - imagesize
    return tf.pad(image3, [[0, padding_[0]], [0, padding_[1]], [0, 0]], padding)

您可以这样称呼：

image = pad_image_to_tile_multiple(image, [28,28])

然后在从图块中重新组装图像后，通过拼接去除 paddig：

image = image[0:original_size[0], 0:original_size[1], :]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow 入门 - 将图像分割为子图像的相关文章

为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
绝对导入不起作用，但相对导入起作用

这是我的应用程序结构 foodo setup py foodo init py foodo py models py foodo foodo foodo py从导入类models py module from foodo models im
在 PhotoImage 下调整图像大小

我需要调整图像大小但我想避免使用 PIL 因为我无法使其在 OS X 下工作不要问我为什么无论如何因为我对 gif pgm ppm 感到满意所以 PhotoImage 类对我来说没问题 photoImg PhotoImage fi
Python 中 time.sleep 和多线程的问题

我对 python 中的 time sleep 函数有疑问我正在运行一个脚本需要等待另一个程序生成 txt 文件虽然这是一台非常旧的机器所以当我休眠 python 脚本时我遇到了其他程序不生成文件的问题除了使用 time sl
如何在动态执行的代码字符串中使用inspect.getsource？

如果我在文件中有这段代码 import inspect def sample p1 print p1 return 1 print inspect getsource sample 当我运行脚本时它按预期工作在最后一行源代码sampl
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
Jupyter笔记本突然变得很慢

我以前在anaconda环境下运行jupyter运行得很好显示警告后 IOPub data rate exceeded The notebook server will temporarily stop sending output to
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条
更新 matplotlib 中颜色条的范围

我想更新一个contourf在函数内绘制效果很好然而数据的范围发生了变化因此我还必须更新颜色条这就是我未能做到的地方请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
Python 或 C 语言中的 Matlab / Octave bwdist()

有谁知道 Matlab Octave bwdist 函数的 Python 替代品此函数返回给定矩阵的每个单元格到最近的非零单元格的欧几里得距离我看到了一个 Octave C 实现一个纯 Matlab 实现我想知道是否有人必须用 AN
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
通过新数据更新绘图，而不是在 Jupyter 笔记本中制作新绘图

我有一些问题希望你能帮我解决我需要使用下拉小部件创建交互式绘图我可以在其中选择并绘制感兴趣的数据我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
python 日志记录替代方案 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案蟒蛇记录模块 http docs python org library logging html使用起来
OSError: [WinError 193] %1 不是有效的 Win32 应用程序，同时使用 CTypes 在 python 中读取自定义 DLL

我正在尝试编写用 python 封装 C 库的代码我计划使用 CTypes 来完成此操作并使用 Visual Studio 来编译我的 DLL 我从一个简单的函数开始在 Visual Studio 内的标头中添加了以下内容然后将其构
正则表达式 - 匹配不包含字符串的模式

我对正则表达式很陌生并且一直在寻找方法来做到这一点但没有成功给定一个字符串我想删除以 abc 开头以 abc 结尾且中间不包含 abc 的任何模式如果我做 abc abc abc 它将匹配以 b 开头以 abc 结尾并且中间包
用 Beautiful Soup 进行抓取：为什么 get_text 方法不返回该元素的文本？

最近我一直在用 python 开发一个项目其中涉及抓取一些网站的一些代理我遇到的问题是当我尝试抓取某个知名代理站点时当我要求 Beautiful Soup 查找 IP 在代理表中的位置时它并没有按照我的预期执行操作我将尝试查找每

随机推荐

在 Flutter 中禁用 firestore 上的缓存

如何禁用从 firestore 上的缓存获取流数据我看到了这篇文章该功能默认启用启用持久性 https cloud google com firestore docs manage data enable offline 这样是不是就
高效创建可观察对象，从可观察集合中过滤特定项目

我有一个 RxJS 主题用于发布对集合的更改每次集合发生变化时主题都会将新内容作为数组发布例如 let collectionSubject new Rx BehaviourSubject collectionSubject onNe
Chart.js 图表上的叠加线

我想知道是否可以在 Chart js 图表上叠加一条线例如折线图例如在 x 轴上将在图表中的值 20 处绘制一条水平线我创建了一个称为叠加图表的东西并将其添加到我的 Chart js 分支中 https github com l
Angular 9 BaseComponent 与 @Injectable()

在 Angular 8 中我能够使用 Injectable 属性创建基本组件继承实际组件的类 Angular 9 编译器告诉我组件 YourComponent 从 BaseComponent 继承其构造函数但后者没有自己的 Angu
一州内的县等值区域地图

我正在努力定制并找到正确的代码来构建分区统计图我正试图通过特定州的县来获取企业的利润到目前为止我所做的是能够绘制我的代码尽管使用了我不想要的调色板和不希望出现的中断 library choroplethr library ggplo
同步 android gradle appcompat 27.0.1

我是 android studio 的新手不确定 gradle 设置我已经下载了 Android API 27 这是我得到的错误错误无法解决 app debug compileClasspath 的依赖关系无法解析 com and
WebGL 中的透明纹理行为

环境 WebGL Chrome 当使用透明 png 作为模型纹理时我有以下行为图像 A 树将建筑物隐藏在其后面我看到了世界框纹理它也隐藏自己后面的分支不可见同时图像 B 工作正常窗口是透明的我可以看到后面的内容 A B 两
如何匹配Python中封装在列表中的两个字典的键？

我有两本词典位于列表中该列表如下所示 10 1 1 0 1 10 1 1 1 2 10 1 1 0 3 10 1 1 1 4 我需要的是相同的键即匹配的 ip 我想要相应的数字或值因此示例输出如下所示 10 1 1 0 1 10 1
优雅地停止 Docker 容器

我无法理解当容器停止时如何进行一些清理为了方便起见我准备了一个示例来重现该问题以下是我的文件的内容 Dockerfile FROM opensuse latest Install tcsh non interactive mode R
如何使用MACROS（VBA）获取Excel中最后一个非空单元格的地址

我想获取 Excel 工作表中最后一个非空单元格的单元格地址基本上我想要最后一个非空单元格的行号和列号名称我发现很少有答案可以找出最后一个非空单元格中的值但我需要单元格地址而不是内容对于这样的数据大多数人都希望找到Blue ce
如何在默认的 Eclipse XML 编辑器中显示拼写建议列表？

我启用了默认的 Eclipse 拼写检查器当我在 Java 编辑器中工作时检测到拼写错误时我可以使用Ctrl 1显示建议的拼写更正列表然而当我使用默认的 XML 编辑器时 Ctrl 1似乎不起作用拼写错误的单词主要是在评论中正
preg_split 意外行为

I use 预分割 http php net manual en function preg split php如下
无法推送到 Google 容器注册表（无法访问存储库）

每当我尝试从本地计算机将容器推送到 Google 容器注册表时都会收到以下错误被拒绝无法访问存储库请检查您是否有权访问它如果我打开 Cloud Shell 我可以毫无问题地推送容器我曾多次尝试执行 gcloud auth log
如何使用 EclipseLink 和 Spring 配置动态编织？

如何使用 EclipseLink 和 Spring 配置动态编织现在我正在尝试让它与 Junit 测试一起工作但稍后我必须让它与 Tomcat 一起工作我的部门已经标准化它大约 10 年了我遇到两个主要问题 1 Spring需要一个
矩阵中元素的频率 - Matlab

从我在 matlab 中运行的函数中我得到一个 225x400 矩阵我想计算这个矩阵中每个元素的频率这意味着我需要计算每个元素在矩阵上出现的次数我的矩阵名称是 Idiff 我在用 B unique Idiff 找到 Idiff 矩阵中
Android TV以编程方式切换HDMI输入端口

我想问一下经验丰富的程序员是否有一种方法可以通过直接安装在电视 Sony Bravia 上的应用程序以编程方式切换 HDMI 输入端口比方说在应用程序启动时电视将其输入切换为 HDMI3 Android 中有通用的 API 还是特定
消除外边距 (Ggplot2 / geom_sf)

我一直想知道是否可以避免 Ggplot2 包含这个外部边距绘图区域周围黑框之外的空白区域我认为又名绘图边距下面是我的代码我可以很好地控制绘图边距但我尝试了不同的方法来减少外部边距但到目前为止没有任何效果我还想澄清一下我知道在
具有特殊条件的子集和

在您回复另一个问题的链接或将其作为重复项关闭之前请仔细阅读该问题这与该问题的标准变体不同我已经搜索了很长时间所以我很确定没有这里没有这样的问题我需要找到是否最小可能的S这是一些的总和X i 的子集那是 gt T 某个目标值小于全
elasticsearch索引已删除

我的 Elasticsearch 服务器面临严重问题我在 symfony2 项目上使用 ES 1 7 和 fosElasticaBundle 今天ES索引被删除了两次我也搞不懂为什么以下是我可以在 cluster log 中读取的日志
Tensorflow 入门 - 将图像分割为子图像

这是我第一次使用卷积神经网络和 Tensorflow 我正在尝试实现一个能够extract来自数字视网膜图像的血管我正在与公开可用的驱动数据库 http www isi uu nl Research Databases DRIVE 图像为

Tensorflow 入门 - 将图像分割为子图像

Tensorflow 入门 - 将图像分割为子图像 的相关文章

随机推荐

热门标签

Tensorflow 入门 - 将图像分割为子图像的相关文章