Keras 中的 Bi-LSTM 注意力模型

2023-12-27

我正在尝试使用词嵌入使用 Bi-LSTM 制作注意力模型。我碰到如何在keras中添加注意力机制？ https://stackoverflow.com/questions/42918446/how-to-add-an-attention-mechanism-in-keras, https://github.com/philipperemy/keras-attention-mechanism/blob/master/attention_lstm.py https://github.com/philipperemy/keras-attention-mechanism/blob/master/attention_lstm.py and https://github.com/keras-team/keras/issues/4962 https://github.com/keras-team/keras/issues/4962.

但是，我对实施感到困惑Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification. So,

_input = Input(shape=[max_length], dtype='int32')

# get the embedding layer
embedded = Embedding(
        input_dim=30000,
        output_dim=300,
        input_length=100,
        trainable=False,
        mask_zero=False
    )(_input)

activations = Bidirectional(LSTM(20, return_sequences=True))(embedded)

# compute importance for each step
attention = Dense(1, activation='tanh')(activations)

我在这里很困惑哪个方程与论文中的方程是什么。

attention = Flatten()(attention)
attention = Activation('softmax')(attention)

RepeatVector 会做什么？

attention = RepeatVector(20)(attention)
attention = Permute([2, 1])(attention)


sent_representation = merge([activations, attention], mode='mul')

现在，我再次不确定为什么这条线在这里。

sent_representation = Lambda(lambda xin: K.sum(xin, axis=-2), output_shape=(units,))(sent_representation)

由于我有两个类，我将最终的 softmax 为：

probabilities = Dense(2, activation='softmax')(sent_representation)

attention = Flatten()(attention)

将注意力权重张量转换为向量（如果序列大小为 max_length，则大小为 max_length）。

attention = Activation('softmax')(attention)

允许所有注意力权重在 0 到 1 之间，所有权重之和等于 1。

attention = RepeatVector(20)(attention)
attention = Permute([2, 1])(attention)


sent_representation = merge([activations, attention], mode='mul')

RepeatVector 重复注意力权重向量（大小为 max_len）与隐藏状态的大小 (20)，以便按元素将激活和隐藏状态相乘。张量变量的大小激活是 max_len*20。

sent_representation = Lambda(lambda xin: K.sum(xin, axis=-2), output_shape=(units,))(sent_representation)

该 Lambda 层将加权隐藏状态向量相加，以获得最终使用的向量。

希望这有帮助！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 中的 Bi-LSTM 注意力模型的相关文章

如何显示 pymongo.errors.OperationFailure 详细信息？

写入 MongoDB 时我在 python 中遇到 pymongo OperationsFailure 除了回溯之外还有没有办法打印出详细信息或代码属性另请参阅 http api mongodb org python current
Keras ImageDataGenerator 验证分割未从打乱的数据集中选择

如何将图像数据集随机拆分为训练数据集和验证数据集更具体地说 validation splitKeras 中的论证ImageDataGenerator函数不是随机地将我的图像分割为训练和验证而是从未洗牌的数据集中分割验证样本当指定val
在Python中绘制像素的最佳方法[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我想知道用 x 和 y 值在 python 中绘制像素的最简单方法是什么可能最简单的方法是使用PIL http effbot org i
如何有效地找到两个轮廓集之间的所有交点

我想知道找到两组轮廓线之间所有交点舍入误差的最佳方法哪种方法最好这是示例 import matplotlib pyplot as plt import numpy as np x np linspace 1 1 500 X Y np
OSMNX - 边缘的哪个“部分”被认为是最近的

我正在使用 OSMNX 中的 returned edges 函数我不清楚在进行此计算时使用边缘的哪个部分它是边缘的任何部分吗是中间点吗对于网络中的长边来说这会产生很大的差异这取决于您如何参数化该函数来自nearest edg
如何使用 BeautifulSoup 排除表中的某些行？

我已经从表格中获得了所需的数据但不想要各个玩家统计数据之间的缩写 Rk Pos Name 等如何在保留所需数据的同时排除这些数据包含缩写的行被归类为 thead 但我不知道如何使用该信息来跳过它我知道玩家的数据都被压缩在一起但现在
当从 python 使用 TSQL（SQL Server 上的 mssql）时，如何自动生成 SQLAlchemy 的 ORM 代码？

SQLAlchemy 依赖于我构建这样的 ORM 类 from sqlalchemy import Column DateTime String Integer ForeignKey func from sqlalchemy orm imp
缓存 pandas 数据框的最佳方法？

昨天我经历了惨痛的教训将 pandas 数据帧保存到 csv 以供以后使用是一个坏主意我有一个包含 130k 条推文的数据框其中数据框的一行是list的推文当我将数据保存到 CSV 然后重新加载数据帧时数据帧的行现在是字符串类型
在 SQLAlchemy 中删除父级后删除子级

我的问题如下我有两个型号Entry and Tag通过 SQLAlchemy 中的多对多关系链接现在我想删除所有Tag没有任何对应的Entry后Entry被删除示例来说明我想要的内容 Entry 1带标签python java Ent
Python条件运算符“if else”不等于“and or”[重复]

这个问题在这里已经有答案了我认为下面两个函数的结果会相同但事实并非如此 def fib2 n return n and n lt 2 or fib2 n 1 fib2 n 2 def fib3 m return m if m lt 2
如何在Python中生成0-1矩阵的所有可能组合？

如何生成大小为 K N 的 0 1 矩阵的所有可能组合例如如果我取 K 2 和 N 2 我会得到以下组合 combination 1 0 0 0 0 combination 2 1 0 0 0 combination 3 0 1 0 0
由 asyncio.new_event_loop 创建的事件循环挂起

以下代码只是挂起而不打印任何内容 import asyncio async def foo loop print foo loop stop loop asyncio new event loop asyncio ensure future
如何向 Iron Python 添加模块？

我一直在尝试使用 C Visual Studio 执行以下 Python 代码 graphcreater py 我通过 NuGet 包管理器添加了 IronPyton 2 7 7 和 IronPython StdLib 2 7 7 一旦我运
Django 和 REST API 服务基于计算的请求

我在 Django 中编写了一个机器学习应用程序以便用户可以在表单中指定一些参数并训练模型模型训练完成后我想满足以下请求 curl http localhost 8000 model input XYZ 我希望 Django 返回给定
Python 生成器每次调用都会产生相同的值

我希望这个生成器生成列表中每个连续值的余弦但每次都得到相同的值 import math angles range 0 361 3 calculate x coords def calc x angle list for a in angl
二进制补码扩展 python？

我想知道是否有一种方法可以像在 Python 中的 C C 中一样使用标准库最好在位数组上进行二进制补码符号扩展 C C Example program include
如何创建使用几个客户端权重的 FL 算法？

基于此link https github com tensorflow federated tree 3c0852c5fef375198f5931ce31fd97f2df9c4d05 tensorflow federated python
检查Python multiprocessing.Connection 的实例吗？

Connection对象是在打开时创建的multiprocessing Pipe 然而尚不清楚如何检查一个对象是否是一个实例Connection 在Python3 3 4 3 3 3 2 中检测Connection我可以 from mu
python chaco轴标签时间格式

在 Enthought 的 Chaco 中 TimeFormatter类用于格式化刻度的时间字符串标签有没有办法指定时间格式类似于time strftime 源代码现在将显示月份和日期时的格式硬编码为美国风格 MMDD 我想添加一些灵
命名空间与常规包

命名空间 Python 包之间有什么区别没有 init py 和一个常规的Python包有一个 init py 特别是当 init py普通包裹是空的吗我很好奇因为最近我忘记了 init py在我制作的包中我从未注意到任何问题事

随机推荐

NSTimer 和更新 UI

我一直在努力让我的游戏能够正常运行NSTimer 我发现很多人都遇到了与我类似的问题我只需要对某些事情进行一些澄清基本上我有一个NSTimer在主线程上运行该线程正在更新代表时间的图像但我也有一个地图视图当用户平移地图时计时器被
将嵌套的 Pojo 对象作为单独的对象存储在数据库中

我使用 jackson 将 json 字符串映射到我的 HTModel 类这基本上是一个简单的 Pojo class HTModel public class Post extends HTModel public String id p
Android 8：不允许明文 HTTP 流量

我收到 Android 8 用户的报告称我的应用程序使用后端提要不显示内容经过调查我发现 Android 8 上发生以下异常 08 29 12 03 11 246 11285 11285 E 12 03 11 245 main Ex
Django 多对多关系添加不起作用

我正在将 Django 的 ManyToManyField 用于我的模型之一 class Requirement models Model name models CharField max length 200 class Course
找到所有套装的组合 - 套装封面？

有人可以分享一个java程序吗它可以执行以下操作如果给出以下集合作为输入 a 1 2 3 8 9 10 b 1 2 3 4 5 c 4 5 7 d 5 6 7 e 6 7 8 9 10 and U 1 2 3 4 5 6 7 8 9 1
如何使用 gson 在 json 现有结构中再插入一项？

下面的代码正确生成 json 文件的第一个结构 gson new GsonBuilder setPrettyPrinting create AudDetHeader AudDetHeader new AudDetHeader ArrayLi
验证重叠 Gem 多个范围相互覆盖

我正在使用 Validates Overlap Gem 可以在这里找到 https github com robinbortlik validates overlap https github com robinbortlik valida
将 UTC 日期转换为其他时区

我正在使用以下方法将 UTC 时间转换为另一个时区 SimpleDateFormat format new SimpleDateFormat yyyy MM dd HH mm ss Date parsed format parse 2011
VBA：IE-如何在不弹出文件上传表单的情况下将路径名分配给文件输入标记？

我目前正在做文件上传的自动化下面是输入文件标签的 HTML 标签
需要一种以平面表示形式进行数组索引的算法

情况如下我正在尝试实施一个适用于N维数组类似下面的代码将成为可能还不是真正的编程语言 int a 10 14 56 将创建一个 3 维数组即长方体或者 int a 10 20 显然会创建一个矩阵为了也能够表示数据我决定为元素
在 ASP.NET 4.5 中，我应该如何编码用作 JavaScript 变量的字符串，以防止 XSS 攻击

我知道有几种方法可以做到这一点但它们都有一些缺点是否有一种公认的被认为是最好的方法我以前用过Microsoft Security Application AntiXss JavaScriptEncode 这很棒但 AntiXS
使 focusout 事件忽略某些元素

在下面的代码中如果您点击
如何在 ASP.Net web 应用程序中引用的项目 DLL 中初始化 AutoMapper 配置文件

关于如何在我的项目类库 dll 中使用自动映射器有点困难请参阅下面我的整体解决方案的结构 WebApp 启动并在 Global asax App Start 中调用 AutoMapper Configure 方法来添加映射配置文件现在
在 Android/Cordova 上 setFlags 后启用在 Window 上的显示

我正在开发我的第一个 Cordova 插件作为更好地学习 Cordova 的一种方法不过我还是有钱的希望你们能在最后一点上提供帮助来源可以在以下位置找到https github com dotnetCarpenter cordov
从任何地方滚动 Div

当我的页面底部 a k a main 进入视图 jQuery 在我的侧边栏上切换一个类使其可滚动overflow y scroll and overflow hidden当页面底部看不见时这里想要的效果是在页面的底部在我的例子中这又
Meteor 模板不使用点击事件更新

我正在尝试使用流星会话创建一个反应式菜单以保留用户的视图但它不起作用 Session get currentView 被更改 chrome 控制台中的 teste 但页面不要再次渲染 html div class col 1 1 men
是否有任何标准的 firestore 查询来获取随机文档？

我正在尝试从动态集合中获取多个随机文档直到知道为止我曾想过使用简单的查询来做到这一点如下所示 Pseudocode arr while arr length lt 5 Start the query at a random posit
为什么在 ViewModel 中声明的 store 没有被加载？

这个问题与尝试将商店绑定到 ViewModel https stackoverflow com questions 44136891 trying to bind a store to a viewmodel 但这是一个不同的问题我在视图
无法解析应用程序模块的所有参数：(？)。在语法错误（compiler.js：1021）站点：stackoverflow.com

将我的 Angular 项目从版本 7 降级到版本 6 并在 ngToolkit 的帮助下集成 Angular Universal 后我在浏览器控制台中收到以下错误消息 Can t resolve all parameters for A
Keras 中的 Bi-LSTM 注意力模型

我正在尝试使用词嵌入使用 Bi LSTM 制作注意力模型我碰到如何在keras中添加注意力机制 https stackoverflow com questions 42918446 how to add an attention mech

Keras 中的 Bi-LSTM 注意力模型

Keras 中的 Bi-LSTM 注意力模型 的相关文章

随机推荐

热门标签

Keras 中的 Bi-LSTM 注意力模型的相关文章