如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

2024-03-29

我正在做一个长文本分类任务，文档中有超过 10000 个单词，我计划使用 Bert 作为段落编码器，然后将段落的嵌入逐步输入 BiLSTM。网络如下：

输入：（batch_size、max_paragraph_len、max_tokens_per_para、embedding_size）

bert层：(max_paragraph_len,paragraph_embedding_size)

lstm层：???

输出层：（batch_size，classification_size）

如何用keras实现呢？我正在使用keras的load_trained_model_from_checkpoint来加载bert模型

bert_model = load_trained_model_from_checkpoint(
        config_path,
        model_path,
        training=False,
        use_adapter=True,
        trainable=['Encoder-{}-MultiHeadSelfAttention-Adapter'.format(i + 1) for i in range(layer_num)] +
            ['Encoder-{}-FeedForward-Adapter'.format(i + 1) for i in range(layer_num)] +
            ['Encoder-{}-MultiHeadSelfAttention-Norm'.format(i + 1) for i in range(layer_num)] +
            ['Encoder-{}-FeedForward-Norm'.format(i + 1) for i in range(layer_num)],
        )

我相信你可以检查以下内容article https://medium.com/@brn.pistone/bert-fine-tuning-for-tensorflow-2-0-with-keras-api-9913fc1348f6。作者展示了如何加载预训练的 BERT 模型，将其嵌入 Keras 层并将其用于定制的深度神经网络。首先安装 google-research/bert 的 TensorFlow 2.0 Keras 实现：

pip install bert-for-tf2

然后运行：

import bert
import os

def createBertLayer():
    global bert_layer

    bertDir = os.path.join(modelBertDir, "multi_cased_L-12_H-768_A-12")

    bert_params = bert.params_from_pretrained_ckpt(bertDir)

    bert_layer = bert.BertModelLayer.from_params(bert_params, name="bert")

    bert_layer.apply_adapter_freeze()

def loadBertCheckpoint():

    modelsFolder = os.path.join(modelBertDir, "multi_cased_L-12_H-768_A-12")
    checkpointName = os.path.join(modelsFolder, "bert_model.ckpt")

    bert.load_stock_weights(bert_layer, checkpointName)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Keras

NLP

bertlanguagemodel

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？的相关文章

防止脚本目录被添加到Python 3中的sys.path

有没有办法阻止脚本的目录被添加到python3中的sys path 由于导入在 python 中是相对的因此我遇到了导入冲突我正在处理的一个遗留项目有一个名为logger py在与内置冲突的脚本的根目录中logger 我使用的自定义构建
AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
Python：按条件绘制多个正/负条形图

这是我第一次用 python 绘制条形图我的 df 操作 key descript score 0 noodles taste 5 1 noodles color 2 2 noodles health 3 3 apple color 7
如何在R中使用OpenNLP获取POS标签？

这是 R 代码 library NLP library openNLP tagPOS lt function x s lt as String x word token annotator lt Maxent Word Token Anno
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
Twython - 如何使用媒体 url 更新状态

在我的应用程序中我允许用户在 Twitter 上发帖现在我想让他们通过媒体更新他们的状态 In twython py我看到一个方法update status with media从文件系统读取图像并上传到 Twitter 我的图像不在文
根据两个预先计算的直方图报告两个样本的 K-S 统计量

Problem 在这里我绘制了存储在文本文件中的 2 个数据集在列表中 dataset 每个包含 218 亿个数据点这使得数据太大而无法作为数组保存在内存中我仍然能够将它们绘制为直方图但我不确定如何通过2 样本KS测试 http
Scrapy 仅抓取每个页面的第一个结果

我目前正在尝试运行以下代码但它只保留每个页面的第一个结果知道可能是什么问题吗 from scrapy contrib spiders import CrawlSpider Rule from scrapy contrib linkext
Python Raspberry pi - 如果路径不存在，则跳过循环

我有一个收集温度文本文件中的值的功能它使用部分预定义的路径但是有时如果温度传感器未加载断开连接则路径不存在如果路径不可用如何设置条件或例外来跳过循环我想使用 continue 但我不知道要设置什么条件 def read
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
Flask-Mail - 基于 Flask-Cookiecutter 异步发送电子邮件

我的烧瓶项目基于烧瓶饼干切割机 https github com sloria cookiecutter flask我需要异步发送电子邮件发送电子邮件的功能由以下配置米格尔的教程 https blog miguelgrinberg com
构建一个简单的解析器，能够使用 PyParse 解析不同的日期格式

我正在构建一个简单的解析器它接受如下查询显示 fizi 从 2010 年 1 月 1 日到 2006 年 2 月 11 日的提交到目前为止我有 class QueryParser object def parser self stmn
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
在 Python 中进行模糊键查找的最佳方法？

我遇到一个问题我需要在哈希映射中进行模糊查找即返回与最接近查询的键相对应的值在我的例子中是通过 Levenshtein 距离测量的我目前的方法是子类化dict使用特殊的查找方法计算所有键的编辑距离然后返回得分最低的键的值基本上是
为什么计算大整数阶乘的“分而治之”方法如此快？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将文本文件转换为 plink PED 和 MAP 格式

我有以下数据其中的一小部分名为 short2 pre snp tumor txt rs987435 C G 1 1 1 0 2 rs345783 C G 0 0 1 0 0 rs955894 G T 1 1 2 2 1 rs608879
使 flake8 区分未定义函数和星型导入

我有一个相当大的项目我试图在发布之前清理它但是当我运行 flake8 时我得到了大量的 F405
类型提示：解决循环依赖

以下产生NameError name Client is not defined 我该如何解决 class Server def register client self client Client pass class Client de
在 python 中使用 ftplib 时

这是导致错误的相关代码 ftp ftplib FTP server ftp login r user r pass change directories to the incoming folder ftp cwd incoming fil
如何将 c_uint 的 ctypes 数组转换为 numpy 数组

我有以下 ctypes 数组 data ctypes c uint 100 我想创建一个 numpy 数组np data包含来自 ctypes 数组数据的整数值 ctypes 数组显然稍后会填充值我看到numpy中有一个ctypes接口

随机推荐

Flask 应用程序中的 Rpy2：致命错误：无法初始化 JIT

我有一个 Flask 应用程序我正在尝试添加一个 RESTful 端点该端点使用 rpy2 从 rds文件当我运行我的测试脚本时python3 testscript py其中包含import rpy2 robjects as obje
Laravel where if 语句

我在从数据库中选择时遇到了问题基本上我想要实现的是我有一个包含 3 列的表 type number date 我需要根据列类型执行操作 If type 1 then where number gt 1 else where date
DbContext AutoDetectChangesEnabled 设置为 false 检测更改

我有点难住了根据我读到的设置DbContext AutoDetectChangesEnabled to false应该禁用需要调用的更改跟踪DbContext DetectChanges为了识别要发送到数据库的更改但是从下面的日志可以
Aria2 不重新下载文件

我正在使用 aria2 下载动态生成的文件列表我希望它跳过下载目录中已有的文件但它没有这样做而是重新下载它们并添加一个 1到文件名我尝试使用 check integrity true 但这并没有改变行为有没有办法让它跳过已经存在的
检查所有复选框jquery

为什么我的js代码中可以一键点击name check all检查所有复选框 HTML div div
我应该使用哪个 Apple 推送通知服务 Java 库？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我需要使用 Java 服务器将推送通知发送到 iOS 设备Apple 推送通知服务 APNS http
ui-router 中 templateUrl 从一种状态动态更改为另一种状态

html a target blank t name a 上面的代码位于 ng repeat 中其中许多模板链接加载了名称和 id 因此当我单击每个链接时 href 将更新并将 id 号附加到所选模板链接我使用相同的控制器生成大约十个
当 html 属性和 css 样式的功能重叠时

1 如果在CSS文件中我们指定以下样式 td text align center 在 Html 文件中我们有 td align left 那么 CSS 文件中设置的值将优先于内联 html 属性因此其中包含的元素 td 单元格将与中心对齐
如何将 package.json 中的所有 npm 依赖项记录到 README.md 中

我想记录所有 npmdevDependencies and dependencies中描述的package json文件到README md文件在同一个项目中以下属性值得关注name description and version 当然
React-Vega 和 React-Vega 工具提示

我在用着react vega lite 官方给出的例子 https vega github io vega lite https vega github io vega lite https vega github io react veg
Anaconda ImportError：/usr/lib64/libstdc++.so.6：找不到版本“GLIBCXX_3.4.21”

当我尝试在 conda 环境中运行 Python 脚本时出现以下导入错误 squad azada scholar fe00 Desktop Toy Problem Team 2 python3 train py Traceback mos
将任何文件转换为二进制文件，反之亦然

我在 StackOverFlow 网站和互联网上搜索了这个问题及其相关问题但仍然没有得到明确的答案我想知道我可以使用什么软件将任何文件关于大小转换为包含此特定文件的零和一仅的文本文件然后将包含这些零和一的文本文件转换回原始文件
如何在不使用 POJO 的情况下利用 Spring Batch？

I know BeanWrapperFieldSetMapper类取决于 POJO 但事情是这样的如果我想利用 Spring Batch 功能但不想创建单独的作业不想编写 POJO 和单独的读取器写入或映射器该怎么办我的要求是读取
如何制作滚动条占位符

我的问题是浏览器窗口垂直滚动条被删除例如overflow hidden 稍后再次出现时会使页面跳转我使用 jQuery 从访问者中删除滚动选项同时运行脚本并将页面滚动到特定点然后使其再次重新出现当滚动条不存在时我可以为滚动条创建
ES 可从curl 访问，但不能从Marvel/Sense 访问

我已经沉浸在 Elastic Search 中 2 个小时了我用 Marvel 成功安装了 ES 使用marvel agent enabled false在 config elasticsearch yml 中并且能够从 Sense 发
使用 commons-exec 流式输出？

谁能给我一个例子来说明如何流式传输外部程序的输出DefaultExecutor 我没有找到任何描述如何执行此操作的文档我的外部进程将运行几个小时因此仅获取所有输出数据是不可行的它必须被流式传输注意此解决方案是同步的因此它不会流式
如何将 bugzilla 中的版本迁移到 redmine 中新的自定义“源版本”字段（我需要什么 SQL 语法）？

我正在将 bugzilla 安装迁移到 redmine 在 bugzilla 中错误总是根据导致问题出现的软件版本进行记录由于 redmine 支持路线图我想做一些迁移的事情我想做的第一部分是将所有当前版本设置移至新的自定义源版本
Powershell相当于Linux：ls -al [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我不经常使用 Powershell 或 Linux 所以我不确定 ls al 在 Powershell 术语中是什么我试图找到一些东西
部署在代理后面的 springdoc-openapi-ui (Swagger UI) 中的“生成的服务器 url”错误

带有 springdoc openapi ui Swagger UI 的 Spring Boot 2 2 应用程序运行 HTTP 端口该应用程序部署到 Kubernetes 并通过 Ingress 将 HTTPS 请求从集群外部路由到服务
如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

我正在做一个长文本分类任务文档中有超过 10000 个单词我计划使用 Bert 作为段落编码器然后将段落的嵌入逐步输入 BiLSTM 网络如下输入 batch size max paragraph len max tokens pe

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？ 的相关文章

随机推荐

热门标签

如何在keras中使用Bert作为长文本分类中的段落编码器来实现网络？的相关文章