在联邦训练中实现数据生成器

2023-12-13

（我已将问题发布在https://github.com/tensorflow/federated/issues/793也许也在这里！）

我已经将自己的数据和模型定制为联合接口和融合的训练。但我对图像分类任务中的一个问题感到困惑，整个数据集非常大并且无法存储在单个数据集中federated_train_data也不会一次性导入到内存中。所以我需要将数据集从硬盘实时批量加载到内存中并使用Keras model.fit_generator代替model.fit在培训期间，人们用来处理大数据的方法。

我想在iterative_process如图像分类教程所示，该模型适合一组固定的数据。有什么方法可以调整代码以使其适合数据生成器？我已经查看了源代码，但仍然很困惑。如果有任何提示，我将非常感激。

一般来说，TFF 认为数据馈送是“Python 驱动程序循环”的一部分，这在编写 TFF 代码时是一个有用的区分。

事实上，在写TFF时，一般可以分为三个层次：

TensorFlow 定义本地处理（即，将在客户端、服务器、聚合器或人们可能想要的任何其他位置进行的处理，但只有一个single放置。
本机 TFF 定义数据通信方式across展示位置。例如，写tff.federated_sum里面的一个tff.federated_computation装饰器；编写此行声明“此数据从客户端移动到服务器，并通过求和运算符聚合”。
Python“驱动”TFF 循环，例如运行单轮。最终级别的工作是完成“真正的”联邦学习运行时要做的事情；这里的一个例子是为某一轮选择客户。

如果牢记这种细分，使用生成器或其他一些惰性求值式构造将数据输入联合计算就会变得相对简单；它只是在 Python 级别完成的。

实现此目的的一种方法是通过create_tf_dataset_for_client方法上的ClientData目的;当你循环时，你的Python代码可以从列表中选择client_ids，然后你可以实例化一个新列表tf.data.Datasets并将它们作为您的新客户数据集传递。这种相对简单的用法的一个例子是here，以及更高级的用法（涉及定义自定义client_datasets_fn这需要client_id作为参数，并将其传递给单独定义的训练循环将是here，在关联到的代码中这张纸.

最后一点：实例化tf.data.Dataset实际上并没有将数据集加载到内存中；数据集仅在迭代时才加载。我从该书的主要作者那里收到了一个有用的提示tf.data.Dataset就是想到tf.data.Dataset更像是一个“数据集配方”，而不是数据集本身的字面实例。有人建议也许更好的名字是DataSource对于这个构造；希望这可以帮助我们了解实际发生的事情的心理模型。同样，使用tff.simulation.ClientData对象通常不应该真正将任何内容加载到内存中，直到在客户端的训练中对其进行迭代；这应该会使管理数据集内存的一些细微差别变得更简单。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在联邦训练中实现数据生成器的相关文章

类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
为什么我们应该在 Keras 中对深度学习数据进行标准化？

我正在 Keras 中测试一些网络架构以对 MNIST 数据集进行分类我已经实现了一个类似于 LeNet 的方法我看到在网上找到的例子中有一个数据标准化的步骤例如 X train 255 我在没有这种标准化的情况下进行了测试我发
Learning_rate 不是合法参数

我正在尝试通过实现 GridSearchCV 来测试我的模型但我似乎无法在 GridSearch 中添加学习率和动量作为参数每当我尝试通过添加这些代码来执行代码时我都会收到错误这是我创建的模型 def define model op
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
如何在张量流中使用带有估计器的衰减学习率？

我正在尝试将 LinearClassifier 与具有衰减学习率的 GradientDescentOptimizer 一起使用 My code def main load data features np load data feature
获取每个训练实例的损失值 - Keras

我想获得每个实例的损失值作为模型训练 history model fit 例如上面的代码返回每个时期的损失值而不是小批量或实例做这个的最好方式是什么有什么建议么在这个 keras 官方文档页面的末尾正是您要寻找的内容https
如何检查安装了哪个版本的 Keras？

问题与标题相同我不想打开 Python 而是使用 MacOS 或 Ubuntu Python 库作者将版本号放入
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
mac安装Tensorflow出错

我正在尝试使用以下说明在 mac 中安装 Tensorflow https www tensorflow org install https www tensorflow org install 但是当我想导入tensorflow时我总是
如何使用 tf.nn.top_k 返回的索引对多维张量进行排序？

我有两个多维张量a and b 我想按以下值对它们进行排序a I found tf nn top k https www tensorflow org versions r1 0 api docs python nn evaluation
使用 keras 澄清 Yolo v3 模型输出

我将 yolo v3 模型与 keras 一起使用该网络为我提供了形状如下的输出容器 1 13 13 255 1 26 26 255 1 52 52 255 所以我找到了这个link https www cyberailab com ho
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
tf-models：official.vision.detection Mask-RCNN 无效参数：indices[1,63] = [1, -1] 未索引到参数形状 [2,100,112,112]

我正在尝试根据此处提供的官方 MaskRCNN 模型训练 Mask RCNN 模型张量流模型 https github com tensorflow models tree master official vision detectio
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
Keras conv1d 层参数：过滤器和 kernel_size

我对 keras 的 conv1d 层中的这两个参数感到非常困惑 https keras io layers convolutional conv1d https keras io layers convolutional conv1d 文
Keras IndexError：索引超出范围

我是 Keras 新手我尝试在数据集上执行二进制 MLP 并且不断使索引超出范围但不知道为什么 from keras models import Sequential from keras layers core import Dens

随机推荐

Nuxt.js - 是否可以将自定义路径/基设置为静态文件的网址？

TLDR 如何更改静态文件路径src nuxt
从 .idea 文件夹中忽略什么？

可能的重复 Intellij Idea 9 10 要签入或不签入源代码管理的哪些文件夹我开始使用 WebStorm 进行 Web 开发但不确定要添加什么以及要从我们的 Git 存储库中排除什么显然里面有一些文件 idea文件夹旨在
更改 DataGridViewRow 的轮廓

如果满足某个条件我想改变轮廓DataGridViewRow蓝色使其脱颖而出我知道这不是BackColor因为它改变了行的背景颜色我尝试过改变ForeColor为蓝色但没有任何变化我不相信这是选择风格因为这种行为不是我想要的有什么建
WPF：如何使 DataGrid 与动态列的绑定可编辑？

我需要将一些数据绑定到具有可变列数的 DataGrid 我使用以下代码使其工作 int n 0 foreach string title in TitleList DataGridTextColumn col new DataGridTex
在 Android 上将 HTML 转换为图像（任何格式）[关闭]

Closed 这个问题需要细节或清晰度目前不接受答案有谁知道如何在Android上将html代码其中包含图像转换为图像我知道如何使用 JLabel JEditorPane 和 BufferedImage 在 Java 上实现它但
具有不可移动、默认可构造值类型的 map/unordered_map

Update 出现在23 5 4 3中here那m 1 版本应该有效 Update2 m 1 正在使用 gcc4 9 1 具体来说 std mutex 假设我想要一个std unordered map
Javascript InnerHTML 删除表单元素中的数据

我有一个带有按钮的表单允许您向表单添加字段
如何正确取消初始化 OpenSSL

在我的 OpenSSL 客户端中我遇到的问题是当我选择静态链接 libeay32 和 ssleay32 而不是动态链接时我从 Visual Leak Detector 收到了大量内存泄漏错误我从 OP 中复制了命令这个线程但我还剩
R 中多个数据帧的相同功能

我是 R 新手这是一个非常简单的问题我发现了很多与我想要的类似的东西但并不完全一样基本上我有多个数据框我只想在所有数据框上运行相同的函数 for 循环可以工作但我不确定如何正确设置它来调用数据帧它似乎也最喜欢使用 R 的 la
php exec() 命令权限被拒绝

我有一个 C 可执行文件 skypeforwarder 如果我在 Mac 的终端中使用命令行 skypeforwarder 就可以工作亨利 Users henry Desktop skypeForwarder skypekit sdk s
如何按照请求的顺序处理 jquery ajax 请求

我正在制作一个 java servlet 页面用于检查域名列表并通过 jquery ajax 请求检查每个名称除了结果被乱序附加到 DOM 之外它工作得很好什么是按请求顺序处理请求但又像长轮询效果一样异步的最佳方法我是 Java
在启动时通过UAC授予c++程序管理权限

所以我做了一些研究但我有兴趣了解如何让他的程序在执行之前向 UAC 请求管理权限这是否需要在 ShellExecute 中使用 runas 我意识到这是我在编程冒险中需要理解的事情因为几乎我安装的每个程序都问过我这个问题例如如果我
如何将整数转换为日期对象Python？

我正在 python 中创建一个模块在其中我收到整数格式的日期例如20120213 表示 2012 年 2 月 13 日现在我想将这个整数格式的日期转换为 python 日期对象另外是否有任何方法可以减去添加此类整数格式日期中
Android R 中的后台服务在省电模式下停止

我编写了一个 Android 应用程序通过更改电量来检查电池电量并在电量达到特定值时发出警报我在我的应用程序中使用了广播接收器和后台服务它在所有 Android 版本中都能正常工作但在 Android R 中当打开省电模式时服
是否可以重命名 Firebase 实时数据库中的密钥？

我想知道有没有办法更新键值让我们使用以下数据我正在使用 set 来写入数据现在我希望用户编辑他们的bookTitle两个地方都需要改变我尝试使用 update 但似乎无法使其工作我只能编辑bookTitle in bookInf
使用 Angular 7 Material CDK 进行嵌套拖放

我有一个拖放列表的嵌套树不是树组件当拖动另一个下拉列表中包含的下拉列表中的项目时两个下拉列表都会触发 Enter Exit 事件这意味着当一个项目被删除时它可以被放入内部下拉列表或容器下拉列表中具体取决于它被删除的地方注意这
共同的偏好和清晰的历史/数据

如果我在android中使用sharedpreference在应用程序的生命周期内将数据本地存储在设备上直到应用程序被卸载当用户选择从android的 gt 菜单 gt 设置 gt 清除数据时是否有丢失数据的风险管理应用程序 gt 清
Java 使用 JDBC - 连接太多？

我正在为一家酒吧编写一个库存补货系统作为我的最后一年项目我可以从 MYSQL 数据库检索信息并且可以一次滚动浏览一个结果我正在尝试根据所选类别更改结果我已经设法使用组合框来实现此目的但在类别之间移动时出现以下错误线程 main
为什么这些 Python tkinter 检查按钮是链接的？

我目前正在尝试创建一个 GUI 来比较两个不同文件夹之间的文件并拥有一个我现在正在尝试构建的基本框架我在窗口的左侧右侧和底部有三个框架每个框架有两个复选按钮我希望能够彼此独立地选择每个复选按钮但每次我单击任何一个框架的第一个复选
在联邦训练中实现数据生成器

我已将问题发布在https github com tensorflow federated issues 793也许也在这里我已经将自己的数据和模型定制为联合接口和融合的训练但我对图像分类任务中的一个问题感到困惑整个数据集非常大并且无

在联邦训练中实现数据生成器

在联邦训练中实现数据生成器 的相关文章

随机推荐

热门标签

在联邦训练中实现数据生成器的相关文章