BERT 输出不确定

2024-05-04

BERT 输出是不确定的。当我输入相同的输入时，我希望输出值是确定性的，但我的 bert 模型的值正在变化。听起来很尴尬，同一个值返回两次，一次。也就是说，一旦出现另一个值，就会出现相同的值并重复。如何使输出具有确定性？让我展示我的代码片段。我使用如下模型。

对于 BERT 实现，我使用 Huggingface 实现的 BERT pytorch 实现。这是 pytorch 领域相当著名的 ri 模型实现。 [关联]https://github.com/huggingface/pytorch-pretrained-BERT/ https://github.com/huggingface/pytorch-pretrained-BERT/

        tokenizer = BertTokenizer.from_pretrained(self.bert_type, do_lower_case=self.do_lower_case, cache_dir=self.bert_cache_path)
        pretrain_bert = BertModel.from_pretrained(self.bert_type, cache_dir=self.bert_cache_path)
        bert_config = pretrain_bert.config

得到这样的输出

        all_encoder_layer, pooled_output = self.model_bert(all_input_ids, all_segment_ids, all_input_mask)

        # all_encoder_layer: BERT outputs from all layers.
        # pooled_output: output of [CLS] vec.

汇集输出

tensor([[-3.3997e-01,  2.6870e-01, -2.8109e-01, -2.0018e-01, -8.6849e-02,

tensor([[ 7.4340e-02, -3.4894e-03, -4.9583e-03,  6.0806e-02,  8.5685e-02,

tensor([[-3.3997e-01,  2.6870e-01, -2.8109e-01, -2.0018e-01, -8.6849e-02,

tensor([[ 7.4340e-02, -3.4894e-03, -4.9583e-03,  6.0806e-02,  8.5685e-02,

对于所有编码器层，情况是相同的，-两次相同。

我从bert中提取词嵌入特征，情况是一样的。

wemb_n
tensor([[[ 0.1623,  0.4293,  0.1031,  ..., -0.0434, -0.5156, -1.0220],

tensor([[[ 0.0389,  0.5050,  0.1327,  ...,  0.3232,  0.2232, -0.5383],

tensor([[[ 0.1623,  0.4293,  0.1031,  ..., -0.0434, -0.5156, -1.0220],

tensor([[[ 0.0389,  0.5050,  0.1327,  ...,  0.3232,  0.2232, -0.5383],

请尝试设置种子。我遇到了同样的问题并设置了种子以确保我们每次都获得相同的值。可能的原因之一可能是 BERT 中发生了 dropout。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

BERT 输出不确定的相关文章

现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
如何提取数字（以及比较形容词或范围）

我正在用 Python 开发两个 NLP 项目它们都有类似的任务提取数值和比较运算符来自句子如下所示 greater than 10 weight not more than 200lbs height in 5 7 feets fas
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
如何训练斯坦福 NLP 情感分析工具

地狱大家我正在使用斯坦福核心 NLP 包我的目标是对推文直播进行情感分析按原样使用情感分析工具对文本态度的分析非常差许多积极因素被标记为中性许多消极因素被评为积极我已经在文本文件中获取了超过一百万条推文但我不知道如何实际获
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
使用正则表达式标记化进行 NLP 词干提取和词形还原

定义一个函数名为performStemAndLemma 它需要一个参数第一个参数 textcontent 是一个字符串编辑器中给出了函数定义代码存根执行以下指定任务 1 对给出的所有单词进行分词textcontent 该单词应包含字
具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
如何在R中使用OpenNLP获取POS标签？

这是 R 代码 library NLP library openNLP tagPOS lt function x s lt as String x word token annotator lt Maxent Word Token Anno
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
举例解释bpe（字节对编码）？

有人可以帮忙解释一下背后的基本概念吗BPE模型除了这张纸 https arxiv org abs 1508 07909 目前还没有那么多解释到目前为止我所知道的是它通过将罕见和未知的单词编码为子词单元序列来实现开放词汇表上的 NMT
管道：多个流消费者

我编写了一个程序来计算语料库中 NGram 的频率我已经有一个函数它消耗一串令牌并生成一个订单的 NGram ngram Monad m gt Int gt Conduit t m t trigrams ngram 3 countFre

随机推荐

将参数传递给 SQL Server 中的 IN 子句[重复]

这个问题在这里已经有答案了可能的重复参数化 SQL IN 子句 https stackoverflow com questions 337704 parameterizing a sql in clause SQL Server 带有声
Windows 通用应用程序串行端口无法打开，SerialDevice.FromIdAsync 始终为 null

我正在尝试在 Windows 通用应用程序中使用串行端口我一直在使用微软的串行示例应用程序作为模板但是我遇到了一个相当奇怪的问题 var dis await DeviceInformation FindAllAsync SerialDe
来自无符号字符缓冲区的 QImage（jpg 格式）

我有类型的缓冲区unsigned char 我用JPG图像填充我想使用此缓冲区将图像绘制到 QLabel 中的应用程序屏幕上我已经这样做了但图像不正确谁能告诉我最好的方法是什么 QPixmap pix QPixmap fromIma
观察者不触发

我正在使用带有选项 API 的 Vue 3 如下面发布的代码所示在watch对象我监视发生的变化isToggleBtnLabelDigitizePolygon 在方法中onDigitizePolygon我改变的值isToggleBtnL
/usr/bin/env: 'python3\r': Windows 中没有抛出此类文件或目录错误

我正在尝试从下面的存储库在我的 Windows 本地计算机中部署 hyperledger sawtooth https github com hyperledger education https github com hyperledge
在 Linux 集群上安装 R `forecast` 包：编译器问题？

我正在寻找测试性能R 更具体地说是一些例程forecast封装在具有 Intel Xeon Phi 协处理器的 HPC 集群上据我所知系统管理员已经建立了R 3 2 5按照英特尔网站上的说明从来源获取 https software in
在 SQL 表中的文本字符串中查找换行符？

我试图在 SQL 表的列中查找换行符和回车符但我不确定语法 I tried SELECT foo FROM test WHERE foo LIKE CHAR 10 尽管我知道该表应该返回结果但我没有得到任何结果我究竟做错了什么 SEL
如何让NSManagedObject不出错？

我目前正在调试另一个开发人员编写的一个大项目该项目使用CoreData我对此很陌生我遇到了崩溃这是由于某些NSManagedObject是一个错误我对什么是错误不太了解我想将对象转换为非错误看看它是否有帮助阅读文档让我想到t
我无法让 jQuery 工作 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 你好我正在尝试一些 jQuery
在 Vapor 应用程序中使用 Fluent 进行连接

我正在努力弄清楚如何使用 Fluent 将两个表连接在一起本质上我想运行这个 SQL 命令 SELECT p name o amount o amount p amount total FROM OrderPoints o INNER J
Angular.js 性能问题

性能选项卡上的 Batarang 显示在应用程序的根目录上 Angular 正在调用如下所示的函数 function a var e f i a eval h m hc i 根据 batarang 的说法它的速度慢得令人痛苦当我在应用程
如何创建 3D 高度图

我有一个 2D 数组 Z 存储该元素位置的高度除了使用方法之外here http matplotlib org mpl toolkits mplot3d tutorial html surface plots其中我需要创建与 Z 大小相同
ElasticSearch 多滚动 Java API

我想从索引中获取所有数据由于项目数量对于内存来说太大我使用滚动很好的功能 client prepareSearch index setTypes myType setSearchType SearchType SCAN setScro
在 LINQ 中选择案例[重复]

这个问题在这里已经有答案了我怎样才能把它翻译成 LINQ 呢 select t age as AgeRange count as Users from select case when age between 0 and 9 then 0
Gson解析没有键值对的字符串

我正在尝试使用 Gson 库解析字符串但没有成功这是我的字符串 1 816513 52 5487566 1 8164913 52 548824 此示例中的问题是没有键值对我查看了其他示例但它们都有键值对看起来不像我的问题我的解决
从 R Markdown 中的字数统计中排除部分

我正在用 Rmarkdown 写一篇论文通过 LaTeX 导出为 PDF 我需要计算正文中的字数对于 LaTeX 文档我使用texcount从命令行使用我的 tex 文档中的以下标签指定要从字数统计中排除的部分 TC ignore
通过排队预加载图像？

我正在寻找一种预加载特定图像并将其添加到队列中的方法这是我目前所处的位置 http shivimpanim org testsite imageloader html http shivimpanim org testsite image
使用PathModifier或MoveYModifier来模拟精灵跳跃

我在 AndEngine 中使用这个方法来确定用户触摸的场景 Override public boolean onSceneTouchEvent Scene pScene TouchEvent pSceneTouchEvent if pSc
如何调试 MySQL 上的锁等待超时？

在我的生产错误日志中我偶尔会看到 SQLSTATE HY000 一般错误 1205 超过锁等待超时尝试重新开始交易我知道当时哪个查询正在尝试访问数据库但是有没有办法找出哪个查询在那个精确时刻拥有锁定暴露这一点的是这个词交易从该
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段

BERT 输出不确定

BERT 输出不确定 的相关文章

随机推荐

热门标签

BERT 输出不确定的相关文章