Keras 模型中的 Softmax 采样

2024-04-30

我考虑过的一些方法：

继承自 Model 类在tensorflow keras中采样softmax https://stackoverflow.com/questions/52732145/sampled-softmax-in-tensorflow-keras

继承自Layer类如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数？ https://stackoverflow.com/questions/47892380/how-can-i-use-tensorflows-sampled-softmax-loss-function-in-a-keras-model

在这两种方法中，模型方法更干净，因为层方法有点老套 - 它将目标作为输入的一部分推入，然后再见多输出模型。

我需要一些帮助来子类化模型类 - 具体来说： 1）与第一种方法不同 - 我想采用任意数量的层，就像我们在指定标准 keras 模型时所做的那样。例如，

class LanguageModel(tf.keras.Model):
    def __init__(self, **kwargs)

2）我希望将以下代码合并到模型类中 - 但想让模型类认识到这一点

def call(self, y_true, input):
        """ reshaping of y_true and input to make them fit each other """
        input = tf.reshape(input, (-1,self.hidden_size))
        y_true = tf.reshape(y_true, (-1,1))
      weights = tf.Variable(tf.float64))
      biases = tf.Variable(tf.float64)
      loss = tf.nn.sampled_softmax_loss(
      weights=weights,
      biases=biases,
      labels=labels,
      inputs=inputs,
      ...,
      partition_strategy="div")
      logits = tf.matmul(inputs, tf.transpose(weights))
      logits = tf.nn.bias_add(logits, biases)
       y_predis = tf.nn.softmax_cross_entropy_with_logits_v2(
                                labels=inputs[1],
                                logits=logits)

3 我想我需要一些指针来指示我应该处理函数式 API 中 Model 类的哪些部分 - 知道我必须编写一个像上面这样的自定义损失函数。我猜问题是访问 tf.nn.sampledsoftmax 函数中的权重

我能想到的最简单的方法是定义一个忽略输出层结果的损失。

完整的 Colab 在这里：https://colab.research.google.com/drive/1Rp3EUWnBE1eCcaisUju9TwSTswQfZOkS https://colab.research.google.com/drive/1Rp3EUWnBE1eCcaisUju9TwSTswQfZOkS

损失函数。请注意，它假设输出层是 Dense(activation='softmax') 并且忽略y_pred。因此，在使用损失的训练/评估期间，密集层的实际输出是 NOP。

进行预测时使用输出层。

class SampledSoftmaxLoss(object):
  """ The loss function implements the Dense layer matmul and activation
  when in training mode.
  """
  def __init__(self, model):
    self.model = model
    output_layer = model.layers[-1]
    self.input = output_layer.input
    self.weights = output_layer.weights

  def loss(self, y_true, y_pred, **kwargs):
    labels = tf.argmax(y_true, axis=1)
    labels = tf.expand_dims(labels, -1)
    loss = tf.nn.sampled_softmax_loss(
        weights=self.weights[0],
        biases=self.weights[1],
        labels=labels,
        inputs=self.input,
        num_sampled = 3,
        num_classes = 4,
        partition_strategy = "div",
    )
    return loss

Model:

def make_model():
  inp = Input(shape=(10,))
  h1 = Dense(16, activation='relu')(inp)
  h2 = Dense(4, activation='linear')(h1)
  # output layer and last hidden layer must have the same dims
  out = Dense(4, activation='softmax')(h2)
  model = Model(inp, out)
  loss_calculator = SampledSoftmaxLoss(model)
  model.compile('adam', loss_calculator.loss)
  return model

tf.set_random_seed(42)
model = make_model()
model.summary()

请注意，SampledSoftmaxLoss 强制最后一个模型层的输入必须具有与类数相同的维度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 模型中的 Softmax 采样的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
import matplotlib.pyplot 给出 AttributeError: 'NoneType' 对象没有属性 'is_interactive'

我尝试在 Pycharm 控制台中导入 matplotlib pyplt import matplotlib pyplot as plt 然后作为回报我得到 Traceback most recent call last File D Pr
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

生成唯一随机数的智能方法

我想生成 00000001 到 99999999 范围内的唯一随机数序列所以第一个可能是 00001010 第二个可能是 40002928 等等最简单的方法是生成一个随机数并将其存储在数据库中下次再执行一次并检查数据库中该数字是否已存
使用概率选择数组值

我还有一个作业要做那就是从黄色蓝色和红色中随机选择一种颜色概率为黄色 3 7 蓝色 1 7 红色 3 7 我知道我可以通过使用类似的方法来解决这个问题黄黄黄蓝红红红但我认为这在编程上不是很好因为当我碰巧发生这种情况时我将不
C++ 模板类问题中的类型条件

使用海湾合作委员会4 2 我有这个条件类型的元模板 template
Phong 着色问题

我正在根据以下内容编写着色器冯模型 http en wikipedia org wiki Phong reflection model 我正在尝试实现这个方程其中 n 是法线 l 是光线方向 v 是相机方向 r 是光反射维基百科文章中更
facebook 发送 API 错误代码：100 API 错误描述：无效参数错误消息：“链接”无效

我正在使用 facebook post GRAPH UI 来发布私人消息并链接到我在 facebook 中的应用程序早些时候它工作正常但从最近两天开始对话框开始抛出错误发生错误请稍后再试 API错误代码 100API错误描述无
为什么 typeof 函数在 C 中不起作用

我使用GCC编译器版本9 2 0 我想在 C 中使用 typeof 函数但它会引发错误错误 typeof 之前的预期表达式如果您需要更多信息请询问我 int a 5 double b the expected result is
Angular 2 材料垫片尺寸

我有下面的代码
如何使用 .NET 压缩目录？

我有一个包含多个文件的目录我想将此文件夹压缩为 zip 或 tar gz 文件我怎样才能用 C 完成他的工作您可以使用DotNetZip 库 http www codeplex com DotNetZip 它有相当丰富和有用的功能 E
覆盖 Chrome 扩展页面 CSS

我正在尝试使用 Chrome 扩展程序页面上的时尚扩展程序但由于某种原因它不起作用我试图用谷歌搜索这个但我只得到关于使用扩展覆盖 CSS 的答案而不是覆盖 Chrome 扩展页面有什么想法为什么它不起作用吗或者我怎样才能强迫它
如何在 Spring WS 中配置双向 SSL 连接，而不使用 Spring boot 和使用单独的 Apache tomcat 服务器？

我需要以双向 SSL 连接安全机制向服务器发送 Soap 请求消息并处理来自服务器的 Soap 响应我正在使用 Spring MVC 和 Spring ws 后者完全使用注释进行配置并且需要配置两种方式 SSL 连接以将肥皂请求发送到
如何给背景图片指定alt和标题？

如何给背景图片指定alt和标题是否可以 div div cont background FFF url images post png no repeat 您不能为 css 背景指定 alt 和标题但可以为 div 指定标题 div t
如何找到两个数组列之间的共同元素？

我有两个以逗号分隔的字符串列 sourceAuthors and targetAuthors val df Seq Author1 Author2 Author3 Author2 Author3 Author1 toDF source ta
为什么我们在 Javascript 中将秒乘以 1000 来添加时间

我正在研究 cookie 我在 Stack Overflow 上发现了一些问题这些问题已经得到解答我在问题中看到答案将秒乘以 1000 我想知道 getTime 返回什么格式这需要乘以 1000 让cookie在30秒后过期 http
Google Project 在开发者控制台中不可见

我之前使用过一个 Google 项目来提供 GCM 服务现在我需要在同一项目下启用firebase 但是当我进入帐户更新配置时它没有显示我之前使用的 Android 应用程序我使用了 2 到 3 个应用程序现在这些应用程序没有出现在
如何通过正则表达式防止感叹号

public static final String REGEX ADDRESS ZIP 0 9 上面用于验证邮政编码的正则表达式似乎允许感叹号即使我在这里不允许不确定错误是什么我需要更改正则表达式模式吗连字符里面是一个元字符字符
Java 客户端与具有相互证书的 WCF 服务互操作 - 无法解析用于验证签名的 KeyInfo

例外 MessageSecurityException 无法解析用于验证签名的 KeyInfo KeyInfo SecurityKeyIdentifier 我必须设置一个 WCF 服务来接收来自 Java 客户端的 SOAP 调用该客户端
iPad 上的 HTML5 视频搜索

我有一个带有自定义搜索栏的 HTML5 视频播放器它在 iPhone 内联播放和浏览器上运行得很好它在 iPad 上也播放得很好并且搜索栏会随着电影播放而更新但由于某种原因我无法搜索所有值都是正确的我正在尝试设置 myPla
降低 Task.Factory.StartNew 线程的优先级

像下面这样的代码将启动一个新线程来完成这项工作有什么方法可以控制该线程的优先级吗 Task Factory StartNew gt everything here will be executed in a new thread I wa
使用nodejs的Forever将console.logs输出到屏幕

我刚刚发现我的nodejs应用程序不断崩溃所以我使用了forever app js启动我的应用程序并在崩溃时自动重新启动 Problem 现在我的应用程序在运行时输出很多有用的信息console log and util log 我以前用
Keras 模型中的 Softmax 采样

我考虑过的一些方法继承自 Model 类在tensorflow keras中采样softmax https stackoverflow com questions 52732145 sampled softmax in tensorflo

Keras 模型中的 Softmax 采样

Keras 模型中的 Softmax 采样 的相关文章

随机推荐

热门标签

Keras 模型中的 Softmax 采样的相关文章