如何在张量流中将TextVectorization保存到磁盘？

2024-04-24

我已经训练了一个 TextVectorization 层（见下文），我想将其保存到磁盘，以便下次可以重新加载它？我努力了pickle and joblib.dump()。这是行不通的。

from tensorflow.keras.layers.experimental.preprocessing import TextVectorization 

text_dataset = tf.data.Dataset.from_tensor_slices(text_clean) 
    
vectorizer = TextVectorization(max_tokens=100000, output_mode='tf-idf',ngrams=None)
    
vectorizer.adapt(text_dataset.batch(1024))

生成的错误如下：

InvalidArgumentError: Cannot convert a Tensor of dtype resource to a NumPy array

我该如何保存它？

不要腌制对象，而是腌制配置和权重。稍后将其解封并使用配置来创建对象并加载保存的权重。官方文档here https://keras.io/guides/serialization_and_saving/.

Code

text_dataset = tf.data.Dataset.from_tensor_slices([
                                                   "this is some clean text", 
                                                   "some more text", 
                                                   "even some more text"]) 
# Fit a TextVectorization layer
vectorizer = TextVectorization(max_tokens=10, output_mode='tf-idf',ngrams=None)    
vectorizer.adapt(text_dataset.batch(1024))

# Vector for word "this"
print (vectorizer("this"))

# Pickle the config and weights
pickle.dump({'config': vectorizer.get_config(),
             'weights': vectorizer.get_weights()}
            , open("tv_layer.pkl", "wb"))

print ("*"*10)
# Later you can unpickle and use 
# `config` to create object and 
# `weights` to load the trained weights. 

from_disk = pickle.load(open("tv_layer.pkl", "rb"))
new_v = TextVectorization.from_config(from_disk['config'])
# You have to call `adapt` with some dummy data (BUG in Keras)
new_v.adapt(tf.data.Dataset.from_tensor_slices(["xyz"]))
new_v.set_weights(from_disk['weights'])

# Lets see the Vector for word "this"
print (new_v("this"))

Output:

tf.Tensor(
[[0.         0.         0.         0.         0.91629076 0.
  0.         0.         0.         0.        ]], shape=(1, 10), dtype=float32)
**********
tf.Tensor(
[[0.         0.         0.         0.         0.91629076 0.
  0.         0.         0.         0.        ]], shape=(1, 10), dtype=float32)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

tensorflow20

pickle

如何在张量流中将TextVectorization保存到磁盘？的相关文章

softmax_cross_entropy_with_logits和loss.log_loss有什么区别？

之间的主要区别是什么tf nn softmax cross entropy with logits and tf losses log loss 两种方法都接受 1 hot 标签和 logits 来计算分类任务的交叉熵损失这些方法在理论上
没有名为“_pywrap_tensorflow_internal”的模块

在尝试验证tensorflow gpu的安装时在尝试执行 import tensorflow as tf 时出现ImportError 我在 Windows 7 上使用 Quadro K620 Tensorflow 是使用 pip 安装的
如何仅从源代码构建 TensorFlow lite 而不是所有 TensorFlow？

我正在尝试使用 Edgetpu USB 加速器与 Intel ATOM 单板计算机和 C API 进行实时推理 Edgetpu 的 C API 基于 TensorFlow lite C API 我需要包含来自tensorflow lite目
将张量的完整值打印到控制台或写入张量流中的文件

我需要将一个大张量 32 32 3 打印到控制台中并且我只得到如下输出 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245 245
将预训练模型从 tfhub 转换为 tflite

我正在尝试转换openimages v4 ssd mobilenet v2 https tfhub dev google openimages v4 ssd mobilenet v2 1到 tflite 使用 pip3 install te
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
在 Tensorflow 中运行 CNN 时训练和测试的奇怪值

我一直在尝试使用自己的数据来训练和评估卷积神经网络其中包含 200 个训练图像和 20 个测试图像我的完整脚本在这里在 Tensorflow 中使用我自己的数据运行卷积网络时出错 https stackoverflow com que
Tensorflow：使用 Adam 优化器

我正在张量流中试验一些简单的模型包括一个看起来与第一个非常相似的模型面向 ML 初学者的 MNIST 示例 http www tensorflow org tutorials mnist beginners index md 但维数稍大一
加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
SciKit-Learn 的分解模块中未安装 LatentDirichletAllocation

我在 SciKit Learn 包中遇到了一些奇怪的问题 SciKit Learn 包内有分解模块其中应包含 LatentDirichletAllocation 函数请参阅此处的文档 https scikit learn org s
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
了解 keras 中不同序列的 lstm 输入形状

我对 keras 和 python 都很陌生我有一个具有不同序列长度的时间序列数据集例如第一个序列是 484000x128 第二个序列是 563110x128 等我已将序列放入 3D 数组中我的问题是如何定义输入形状因为我很困惑
Colab TPU 调用 model.fit() 时出错：UnimplementedError

我正在尝试分类cifar10 图片 https www tensorflow org datasets catalog cifar10与谷歌 colab TPU 合作根据官方教程 https www tensorflow org guid
3D 卷积神经网络输入形状

我在使用 3D CNN 提供数据时遇到问题Keras http keras io和 Python 对 3D 形状进行分类我有一个文件夹其中包含一些 JSON 格式的模型我将这些模型读入 Numpy 数组模型为 25 25 25 表示
如何将 model.summary() 保存到 Keras 中的文件？

有model summary 方法 https keras io models about keras models 在喀拉斯它将表打印到标准输出是否可以将其保存到文件中如果您想要摘要的格式您可以传递print功能为model su
Google Cloud ML：输出的外部尺寸必须未知

我们在本地得到了一个工作的导出模型正在创建一个新的模型版本谷歌云机器学习如下 Create Version failed Model validation failed Outer dimension for outputs must b
Python 对象什么时候可以被 pickle

我正在使用多处理模块在 Python 中进行大量并行处理我知道某些对象可以是 pickle 因此作为 multi p 中的参数传递而其他对象则不能例如 class abc pass a abc pickle dumps a ccopy
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
使用两个图像的平方差作为张量流中的损失函数

我正在尝试使用两个图像之间的 SSD 作为我的网络的损失函数 h fc2 is my output layer y is my label image ssd tf reduce sum tf square y h fc2 train st

随机推荐

如何使用 JavaScript 检查按钮是否被点击

有没有一种简单的方法可以沿着这些思路做一些事情 JavaScript if document getElementById button clicked true alert button was clicked HTML
将glm四元数转换为旋转矩阵并与opengl一起使用

所以我将对象的方向存储在 glm fquat 中我想用它来旋转我的模型我怎么做我试过这个 glPushMatrix glTranslatef position x position y position z glMultMatrixf
编译器可以将函数范围的、非静态的 const 数组存储在常量数据中并避免每次调用初始化吗？

读书中字符数组字符串如何存储在二进制文件 C C 中 https stackoverflow com q 71932148 364696 我在思考原始字符串涉及的各种方式 Nancy 将在生成的二进制文件中完好无损地显示那个帖子的案例是
文件类型 .pl 关联并使用 cmd.exe 运行脚本

我创建了一个新的文件类型 pl 资源管理器 gt 工具 gt 文件夹选项 gt 文件类型现在我想创建一个新的操作它将调用 cmd exe 并自动运行 PERL 脚本我不知道在用于执行操作的应用程序下要写什么我必须向 cmd ex
在 R 中将 NA 设置为 0

将一个数据帧与另一个数据帧合并后偶尔会留下随机的 NA 我想将这些 NA 设置为 0 以便我可以用它们执行计算我正在尝试这样做 bothbeams data within bothbeams data bothbeams data x
NSMutableArray 不添加对象[重复]

这个问题在这里已经有答案了我认为我犯了一个非常基本的错误但我正在使用NSMutableArray这不知何故并没有添加对象我正在按其方式发送它我有一个属性并合成 property nonatomic strong NSMutabl
如何惯用地复制切片？

在 Go 中复制切片是标准操作如下所示 It will figure out the details to match slice sizes dst copy dst n src m 在 Rust 中我找不到类似的替换方法我想出的
如何将 ActiveRecord 模型属性从 json 迁移到 jsonb？

迁移应该是什么样子我想利用 jsonb 数组查询技术我会这样写迁移 def change reversible do dir dir up change column models attribute jsonb USING CAST
持久订阅 ActiveMQ

我正在尝试为我的消息设置持久订阅者以便即使在服务器重新启动后它们也能保留在主题中但在配置过程中我收到与 xml 相关的错误这是我的配置 xml
sin 和 cos 很慢，有其他选择吗？

我的游戏需要移动一定的角度为此我通过 sin 和 cos 获得角度向量不幸的是正弦和余弦是我的瓶颈我确信我不需要这么精确是否有替代 C sin cos 和查找表的方法既相当精确又非常快我发现了这个 float Skelet
TypeScript getter setter 约定

TypeScript 中类属性的约定标准是什么在 Angular 2 演示来自 Angular io 的英雄之旅中所有属性都设置为 public export class Hero id number name string 所
允许按位运算的通用约束？

我有一个enum public enum Flags COMMAND MSG 1 COMMAND FILE 2 COMMAND ACTION 4 现在假设我设置了多个值例如 Flags g Flags COMMAND ACTION Fl
激活conda环境在vscode中停止工作

我注意到conda激活环境没有明显原因就停止在 vscode 集成终端中工作我当然没有安装任何新的扩展也没有在过去几天更新 conda 或 vscode 预期行为运行 conda activate 环境后我希望激活环境并能够使用环境
Mercurial 子存储库 - 管理更复杂的依赖关系层次结构

我有一个主项目它使用相当标准的源代码树方法 Mercurial 子存储库 Master lib compiled binaries things like log4net AutoFac etc source VS solution o
自动将不同的 Excel 文件导入 MS Access 2010 表

我想将所有 Excel 文件具有不同的数据和列从某个目录导入到 MS Access 2010 数据库中为每个文件创建新表我找到了将文件导入到一张表中的代码 Option Compare Database Option Explici
geany 自定义文件类型 .svrf 用于语法突出显示

我有一个类似的问题我复制并编辑了filetype extensions conf in my config geany adding CALIBRE rul svrf SVRF cal 然后下 config geany filedefs我
如何调试意外静默终止的 win32 进程？

我有一个用 C 编写的 Windows 应用程序有时会消失我使用蒸发这个词是因为没有留下任何东西没有来自 Windows 的我们很抱歉消息没有来自 Dr Watson 设施的故障转储有一次崩溃发生在调试器下调试器没有中断
React Native STUCK 启动打包器

由于某种原因当我想启动我的 React Native 项目时它卡在正在启动 Packager 部分我尝试删除节点包然后重新安装它们通过yarn npm安装它们但没有成功我不知道该如何解决这个问题太尴尬了我遇到过同样的问题
正确结束 Java 命令行应用程序

我只是想知道我需要打电话吗System exit 0 就在之前mainJava 命令行应用程序的方法结束了吗如果是这样为什么如果我总是放在那里与让它自行退出有什么区别0 什么没清理干净提前致谢不您并不总是需要打电话Syste
如何在张量流中将TextVectorization保存到磁盘？

我已经训练了一个 TextVectorization 层见下文我想将其保存到磁盘以便下次可以重新加载它我努力了pickle and joblib dump 这是行不通的 from tensorflow keras layers ex

如何在张量流中将TextVectorization保存到磁盘？

Code

如何在张量流中将TextVectorization保存到磁盘？ 的相关文章

随机推荐

热门标签

如何在张量流中将TextVectorization保存到磁盘？的相关文章