通过 feature_columns 使用 Dataset API 将自由文本特征输入 Tensorflow Canned Estimators

2024-04-14

我正在尝试建立一个模型reddit_score = f('subreddit','comment')

主要是作为一个示例，我可以在此基础上构建一个工作项目。

我的代码是here https://github.com/andrewm4894/my-google-cloudml-tensorflow-examples/tree/master/reddit_score.

我的问题是我看到罐头估算器例如DNN线性组合回归器 https://www.tensorflow.org/api_docs/python/tf/contrib/learn/DNNLinearCombinedRegressor必须具有属于以下部分的 feature_columnsFeatureColumn class.

我有我的词汇文件，并且知道如果我只限于评论的第一个单词，我可以做类似的事情

tf.feature_column.categorical_column_with_vocabulary_file(
        key='comment',
        vocabulary_file='{}/vocab.csv'.format(INPUT_DIR)
        )

但是如果我从评论中传递前 10 个单词，那么我不知道如何从像这样的字符串开始"this is a pre padded 10 word comment xyzpadxyz xyzpadxyz" to a feature_column这样我就可以构建一个嵌入来传递给deep具有广泛而深入的模型特征。

看起来它一定是非常明显或简单的东西，但我一生都找不到任何具有这种特定设置的现有示例（罐装的宽和深、数据集 API 以及功能的混合，例如 subreddit 和原始文本功能，例如评论）。

我什至考虑自己进行词汇整数查找，这样comment我传入的功能类似于 [23,45,67,12,1,345,7,99,999,999]，然后也许我可以通过带有形状的 numeric_feature 获取它，然后从那里用它做一些事情。但这感觉有点奇怪。

您可以使用 tf.string_split()，然后执行 tf.slice() 对其进行切片，注意首先使用 tf.pad() 处理带有零的字符串。看一下标题预处理操作：https://towardsdatascience.com/how-to-do-text-classification-using-tensorflow-word-embeddings-and-cnn-edae13b3e575 https://towardsdatascience.com/how-to-do-text-classification-using-tensorflow-word-embeddings-and-cnn-edae13b3e575

有了单词后，您就可以创建十个特征列

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

通过 feature_columns 使用 Dataset API 将自由文本特征输入 Tensorflow Canned Estimators 的相关文章

使用两个图像的平方差作为张量流中的损失函数

我正在尝试使用两个图像之间的 SSD 作为我的网络的损失函数 h fc2 is my output layer y is my label image ssd tf reduce sum tf square y h fc2 train st
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
如何在 Windows 上的 Python 2.7 上安装 Tensorflow？

我尝试通过 pip 安装 TensorFlow pip install tensorflow 但是得到这个错误找不到满足tensorflow要求的版本来自版本这个问题有解决办法吗我还是想通过pip安装如果您只因为 Keras 而需
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
524 错误和 Jupyterlab api 状态 - 不健康

我们如何解决 GCP JupyterLab 上的以下错误尝试了 stackoverflow google cloud 上已有的解决方案但没有一个有效请帮忙 1 https i stack imgur com IfVWt png htt
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功

随机推荐

Node.js 未处理的拒绝错误

我的代码中出现未处理的拒绝错误但跟踪不会告诉我导致该错误的原因我认为这是webp cwebp导致问题的电话当我运行代码时我成功转换了图像和日志状态然后遇到了未处理的拒绝貌似我没有进入最后两个 then 阻塞因为没有控制台消息被
当模块内且选择标准发生更改时，如何更新 Shiny 中的 DT 数据表

我尝试制作一个闪亮的模块来使用 DT 包呈现来自数据帧的数据我想使用一个模块来对 DT 表选项如语言和其他选项进行标准设置我希望用户能够以交互方式选择数据的不同子集然后能够将数据视为 DT 表子集的选择将在模块外部生成因为我希
如何在 Vue.js 中使用“img src”？ [复制]

这个问题在这里已经有答案了我的 Vue js 模板中有这个 img src media avatars joke avatar alt 它位于一个呈现笑话的循环内其他字段渲染得很好但对于图像我在控制台中收到此错误 src media
使用 kotlin 自定义风格中的 ClassNotFoundException

我定义了自己的风格并设置了sourceSet sourceSets main java srcDirs src main kotlin WORKS myflavor java srcDirs src myflavor kotlin DOES
LinearLayout 使用 java 代码动态设置边框颜色，无需 XML

我对这个问题做了一些研究但还没有发现类似的东西首先我使用 ShapeDrawable 制作线性布局的边框然后我尝试在 LinearLayout 上设置背景颜色但颜色未设置然后我注释了两行 ShapeDrawable 然后在设置线性
将 GMT 时间转换为 EST

我的 sql 服务器位于 GMT 我需要获得 EST 等效 tz 不知何故 EST 是错误的 select now convert tz now GMT EST convert tz now GMT EST interval 10 minu
计算 Java 集合中出现次数的优雅方法

给定一个可能有重复项的对象集合我希望最终得到每个对象的出现次数我通过初始化一个空的来做到这一点Map 然后迭代Collection并将对象映射到其计数每次映射已包含该对象时增加计数 public Map
.NET 通过时区名称获取时区偏移量

在数据库中我将所有日期时间存储为 UTC 我知道用户的时区名称例如美国东部标准时间为了显示正确的时间我想我需要将用户的时区偏移量添加到 UTC 日期时间但是我如何获得时区名称的时区偏移量谢谢你您可以使用TimeZoneI
计算字符串中最大连续 RE 组的数量[重复]

这个问题在这里已经有答案了如何计算字符串中连续字符串组的最大数量 import re s HELLOasdHELLOasdHELLOHELLOHELLOasdHELLOHELLO Give me the max amount of con
SwiftUI - 如何在 macOS 上将 onCommand 与 NSMenuItem 结合使用

我正在尝试找到在 macOS 上将 NSMenuItem 与 SwiftUI onCommand 连接的最佳解决方案目前我正在做以下事情在 AppDelegate 中我创建了一个虚拟函数以便能够列出第一响应者收到的操作列表的函数 I
IntelliJ 工件 JAR 文件：无法找到或加载主类

我在 IntelliJ 中创建了一个 JAR 工件可以选择将 JAR 文件提取到目标 JAR 看起来像这样我正确填写了清单信息我使用 ZIP 检查了 JAR 文件的内容它包含 jar 文件正确填充的 MANIFEST MF 和我的
隐藏文件输入在提交时不保留值

我有一个带有假按钮的隐藏文件输入和用于浏览器显示一致性的输入我目前也可以看到原始输入并且发现使用它上传文件一切运行正常然而使用 dummyfile 中的按钮通过 javascript 触发点击该值将按预期加载并且在 UI 中也是
如何在 Linux 上动态插入 Python 中的 C 函数（无需 LD_PRELOAD）？

我如何在运行时不LD PRELOAD 拦截挂钩 C 函数例如fopen 在 Linux 上就像 Windows 上的 Detours 一样我想从 Python 执行此操作因此我假设该程序已经在运行 CPython VM 并重新
文件上传 API：多部分/表单数据与正文中的原始内容？

我注意到至少有两种方法可以通过 API 将文件上传到 HTTP 服务器您可以使用multipart form data 这是浏览器本机对文件上传 HTML 输入所做的操作但您也可以POST请求正文中的文件内容可能具有正确的 Con
无效的 int 输入陷入无限循环[重复]

这个问题在这里已经有答案了 do cout lt lt Enter the numerator and denominator of the first fraction cin gt gt a gt gt b cout lt lt end
通过另一个表对 hasMany 进行 Sequelize

好的我有以下三个models Module var Module sequelize define module id DataTypes INTEGER name DataTypes STRING description DataTyp
Linux 核心转储太大！

最近我注意到应用程序生成的核心转储的大小有所增加最初它们的大小约为 5MB 包含大约 5 个堆栈帧现在我的核心转储超过 2GB 其中包含的信息与较小的转储没有什么不同有什么方法可以控制生成的核心转储的大小吗它们不应该至少小于应用
使用 Neo4J 和 Spring Data 按 ID 创建关系

我定义了一个简单的节点对象如下所示 Node product public class Product Id private String sku Relationship type SOLD BY private Set
如何更改应用商店中的销售国家/地区[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案您好我的应用程序出现在美国商店但它主要是澳大利亚应用程序如何让它出现在澳大利亚应用商店而不是美国应用商店中但是我仍然可以在澳大利亚应用商店中搜
通过 feature_columns 使用 Dataset API 将自由文本特征输入 Tensorflow Canned Estimators

我正在尝试建立一个模型reddit score f subreddit comment 主要是作为一个示例我可以在此基础上构建一个工作项目我的代码是here https github com andrewm4894 my google

通过 feature_columns 使用 Dataset API 将自由文本特征输入 Tensorflow Canned Estimators

通过 feature_columns 使用 Dataset API 将自由文本特征输入 Tensorflow Canned Estimators 的相关文章

随机推荐

热门标签