使用估计器 api 避免 tf.data.Dataset.from_tensor_slices

2024-03-13

我正在尝试找出推荐的使用方法datasetapi 连同estimatorAPI。我在网上看到的所有内容都是以下内容的一些变体：

def train_input_fn():
   dataset = tf.data.Dataset.from_tensor_slices((features, labels))
   return dataset

然后可以将其传递给估计器的训练函数：

 classifier.train(
    input_fn=train_input_fn,
    #...
 )

but the 数据集指南 https://www.tensorflow.org/guide/datasets警告：

上面的代码片段会将特征和标签数组作为 tf.constant() 操作嵌入到 TensorFlow 图中。这对于小数据集效果很好，但会浪费内存——因为数组的内容将被复制多次——并且可能会遇到 tf.GraphDef 协议缓冲区的 2GB 限制。

然后描述了一种方法，该方法涉及定义占位符，然后用feed_dict:

features_placeholder = tf.placeholder(features.dtype, features.shape)
labels_placeholder = tf.placeholder(labels.dtype, labels.shape)

dataset = tf.data.Dataset.from_tensor_slices((features_placeholder, labels_placeholder))

sess.run(iterator.initializer, feed_dict={features_placeholder: features,
                                          labels_placeholder: labels})

但如果你正在使用estimatorapi，您没有手动运行会话。那么你如何使用dataset带有估计器的 api，同时避免了相关的问题from_tensor_slices()?

要使用可初始化或可重新初始化迭代器，您必须创建一个继承自 tf.train.SessionRunHook 的类，该类可以在训练和评估步骤期间多次访问会话。

然后，您可以使用这个新类来初始化迭代器，就像您通常在经典设置中所做的那样。您只需要将这个新创建的钩子传递给训练/评估函数或正确的训练规范即可。

以下是您可以根据自己的需求进行调整的简单示例：

class IteratorInitializerHook(tf.train.SessionRunHook):
    def __init__(self):
        super(IteratorInitializerHook, self).__init__()
        self.iterator_initializer_func = None # Will be set in the input_fn

    def after_create_session(self, session, coord):
        # Initialize the iterator with the data feed_dict
        self.iterator_initializer_func(session) 


def get_inputs(X, y):
    iterator_initializer_hook = IteratorInitializerHook()

    def input_fn():
        X_pl = tf.placeholder(X.dtype, X.shape)
        y_pl = tf.placeholder(y.dtype, y.shape)

        dataset = tf.data.Dataset.from_tensor_slices((X_pl, y_pl))
        dataset = ...
        ...

        iterator = dataset.make_initializable_iterator()
        next_example, next_label = iterator.get_next()


        iterator_initializer_hook.iterator_initializer_func = lambda sess: sess.run(iterator.initializer,
                                                                                    feed_dict={X_pl: X, y_pl: y})

        return next_example, next_label

    return input_fn, iterator_initializer_hook

...

train_input_fn, train_iterator_initializer_hook = get_inputs(X_train, y_train)
test_input_fn, test_iterator_initializer_hook = get_inputs(X_test, y_test)

...

estimator.train(input_fn=train_input_fn,
                hooks=[train_iterator_initializer_hook]) # Don't forget to pass the hook !
estimator.evaluate(input_fn=test_input_fn,
                   hooks=[test_iterator_initializer_hook])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

使用估计器 api 避免 tf.data.Dataset.from_tensor_slices 的相关文章

多重处理：如何从子进程重定向标准输出？

注意我见过multiprocessing Process 的日志输出 https stackoverflow com questions 1501651 log output of multiprocessing process 不幸的是
在 python 的 Visual Studio 工具中按下 ctrl+F5 后，控制台窗口立即关闭

我已经安装了 Visual Studio 的 Python 工具但在控制台窗口中看不到输出就像我在 Visual Studio 中运行 C 控制台应用程序时按以下快捷键时看到的输出一样 F5 开始调试程序并关闭 C 和 Python 中
如何用spaCy获取依赖树？

我一直在尝试寻找如何使用 spaCy 获取依赖树但我找不到任何有关如何获取树的信息只能在如何导航树 https spacy io usage examples subtrees 如果有人想轻松查看 spacy 生成的依赖关系树一种解决
无法将 datetime.datetime 与 datetime.date 进行比较

我有以下代码并收到上述错误由于我是 python 新手我无法理解这里的语法以及如何修复错误 if not start or date lt start start date 有一个datetime date 从日期时间转换为日期的方法
将 Django 表单中的所有 CharField 表单字段输入转换为小写

我使用 Django 表单进行用户注册用户可以在其中输入优惠券代码我希望在优惠券代码字段中输入的所有字符都转换为小写我尝试过在保存方法自定义清理方法和自定义验证器中使用 lower 但这些方法没有运气下面是我的代码 class S
使用reduce方法的斐波那契数列

于是我看到有人用reduce方法来计算斐波那契数列这是他的想法 1 0 1 1 2 1 3 2 5 3 对应于 1 1 2 3 5 8 13 21 代码如下所示 def fib reduce n initial 1 0 dummy ra
我有一个 Employee 类，我想返回“姓名”列表

我有一个 Employee 类我想返回姓名列表雇员 py class Employee object def init self id name members None self id id self name name self
如何解码 dtype=numpy.string_ 的 numpy 数组？

我需要使用 Python 3 解码按以下方式编码的字符串 gt gt gt s numpy asarray numpy string hello nworld gt gt gt s array b hello nworld dtype S1
Pandas，按最大返回值进行分组 AssertionError：

熊猫有问题我想听听你的意见我有这个数据框我需要在其中获取最大值代码就在下面 df stack pd DataFrame 1 0 2016 0 NonResidential Hotel 98101 0 DOWNTOWN 47 6122
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
Python time.sleep - 永不醒来

我认为这将是那些简单的问题之一但它让我感到困惑停止媒体我是对的找到了解决方案查看答案我正在使用 Python 的单元测试框架来测试多线程应用程序很好而且很直接我有 5 个左右的工作线程监视一个公共队列以及一个为它们制作工作
Docker 日志中的 Python 异常标记为流：stdout

我想解析和处理来自 docker 容器的所有错误但当我期望 stderr 时 Python 异常标记为 stdout 举个简单的例子app py raise Exception 然后我在 docker 容器中运行这个文件但在 var l
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
python 中的基本矩阵转置

我尝试了 python 中矩阵转置的最基本方法但是我没有得到所需的结果接下来是代码 A 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 print A def TS A B A for i in range len A
使用 pandas 绘制带有误差线的条形图

我正在尝试从 DataFrame 生成条形图如下所示 Pre Post Measure1 0 4 1 9 这些值是我从其他地方计算出来的中值我还有它们的方差和标准差以及标准误差我想将结果绘制为具有适当误差线的条形图但指定多个误差值
Python：如何从文件中的一行读取字符并将它们转换为浮点数和字符串，具体取决于它们是数字还是字母？

我有一个如下所示的文件 1 1 C C 1 9873 2 347 3 88776 1 2 C Si 4 887 9 009 1 21 我想逐行读取文件的内容当我使用的行上只有数字时 for line in readlines file d
python csv按列转换为字典

是否可以将 csv 文件中的数据读取到字典中使得列的第一行是键同一列的其余行构成列表的值例如我有一个 csv 文件 strings numbers colors string1 1 blue string2 2 red string
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
从 Flask 中的 S3 返回 PDF

我正在尝试在 Flask 应用程序的浏览器中返回 PDF 我使用 AWS S3 来存储文件并使用 boto3 作为与 S3 交互的 SDK 到目前为止我的代码是 s3 boto3 resource s3 aws access key id

随机推荐

参数类型“Map Function()”无法分配给参数类型“Map ”

这最初可能有效但在 firebase 更新后现在给我这个错误我已在给出错误的部分添加了星号错误消息已添加到代码下方 import package cloud firestore cloud firestore dart class
Grails 从服务中渲染视图？

我刚刚开始在 Grails 中使用服务在尝试从服务内部渲染页面时遇到问题我尝试了如下所示的几种方法但没有成功服务电话 1 GroupCheckService isEnabled userObjects group notenable
在 AuthorizeAttribute Mvc Core Web Api 中获取控制器实例

我使用下面的类来控制我的 api 方法请求并设置 BaseController 类的一些属性以在方法中常用这个来自 Asp Net Mvc Web Api using System using System Collections Ge
如何使用 R 找到数据中最常见的序列？

我正在尝试弄清楚如何使用rollapply函数从Zoo包来查找数据集中最常见字符串的序列但我还需要对某些变量例如日期行等进行分组在进一步讨论之前值得注意的是该查询建立在我之前在此发布的一个问题的基础上如何使用 Table
React/Router/MemoryRouter - 如何传递历史属性并在子组件中使用push()？

我正在构建一个 React 应用程序我不希望更新浏览器中的 URL 我没有使用 react router dom 而只使用 react router 和 MemoryRouter https reacttraining com react
cos-extensions 安装 gpu 无法在 GCP Compute Engine 虚拟机上下载驱动程序签名

我正在 GCP 计算引擎上使用支持 GPU 的虚拟机作为操作系统我使用容器优化版本 COS 89 16108 403 47 LTS 它支持通过 SSH 运行 cos extensions install gpu 来安装简单的 GPU 驱
使用 cython 为一组文件制作一个 pyd [重复]

这个问题在这里已经有答案了我在一个包中有多个 py 文件 packageA init py mod1 py mod2 py mod3 py 我可以配置 cython 进行编译然后将它们全部打包在一个中吗packageA pyd 就我个人而
如何在 Ruby 中生成随机日期？

我的 Rails 3 应用程序中有一个模型其中有一个date field class CreateJobs lt ActiveRecord Migration def self up create table jobs do t t da
路径为空的 Uri

是否可以使用 System Uri 来表示带有空路径组件的 URL 每当我创作时 new Uri http example com Net 4 似乎坚持附加尾部斜杠从而创建不同的 URL 换句话说 new Uri http example
我的调试 AndroidManifest.xml 给出“无法解析符号错误”
按字母顺序对 Enum.values() 进行排序并将它们添加到 Spinner ArrayAdapter

我正在开发一个与 Web 服务配合使用的 Android 应用程序我想按字母顺序排序Enum values 通过其描述我有这个Enum public enum Stature tall 0 MSDApplication getAppCo
ggplot geom_point随窗口大小变化大小

我在创建地图时遇到一些问题ggplot2在上面我使用投影点geom point 当导出为 pdf 或其他支持时点大小会有所不同因为她是绝对的而不是相对于轴的我搜索了如何改变它并找到了很多答案说这是故意的因为如果不是这种情况每
如何使用 Spring Security 在用户首次登录时强制更改密码

使用 Spring Security 在用户首次登录时实现强制密码更改的最优雅的方法是什么我尝试实施自定义AuthenticationSuccessHandler如上所述here https stackoverflow com a 333
OpenCV：“libopencv_core.so.2.3：无法打开共享对象文件：没有这样的文件或目录”

我刚刚在 Debian 机器上安装了 OpenCV 但遇到了问题我按照 Wiki 上的安装指南进行操作尝试编译这些示例似乎可以成功编译但是尝试运行它们最终会抛出错误 fagg hubble src OpenCV 2 3 1 sampl
如何创建没有代码隐藏文件的 ASMX Web 服务页面

我已经能够创建没有后台代码的 ASPX 页面但我一生都无法找出让 ASMX 页面在没有后台代码的情况下工作的神奇组合这可能吗快速样本 using System using System Data using System Web us
从 java 运行 R 脚本 - Rconnection eval 异常

我怎么解决这个问题我尝试清空缓存重新安装 R 和 Rscript connection new RConnection String path source rScript getFile getAbsolutePath connect
如何执行两个 SpatialPolygonsDataFrame 对象的矢量叠加？

我有两个 GIS 图层称呼它们为Soils and Parcels 存储为SpatialPolygonsDataFrames SPDFs 我想覆盖它们在此处描述的意义上 http resources esri com help 9
align-self：flex-end 在 Flexbox 中不起作用

我正在使用 milligram css 一个微型 CSS 框架 https milligram github io grids 我想将列内的 DIV 与底部对齐但没有任何反应 DIV 始终顶部对齐 https jsfiddle net f
机架攻击：IP 地址数组

我正在尝试创建一个 IP 地址数组以便当应用程序运行时 Rack Attack 可以从允许访问该应用程序的 IP 地址集中进行识别所以我所做的如下 a 127 0 0 1 Rack Attack blacklist allow from
使用估计器 api 避免 tf.data.Dataset.from_tensor_slices

我正在尝试找出推荐的使用方法datasetapi 连同estimatorAPI 我在网上看到的所有内容都是以下内容的一些变体 def train input fn dataset tf data Dataset from tensor sl

使用估计器 api 避免 tf.data.Dataset.from_tensor_slices

使用估计器 api 避免 tf.data.Dataset.from_tensor_slices 的相关文章

随机推荐

热门标签