关于Bert被质疑利用“虚假统计性提示”的ACL论文

2023-11-17

曾经狂扫11项记录的谷歌NLP模型BERT，近日遭到了网友的质疑：该模型在一些基准测试中的成功仅仅是因为利用了数据集中的虚假统计线索，如若不然，还没有随机的结果好。这项研究已经在Reddit得到了广泛的讨论。——引用自《新智元》

真的不想那么标题党，前天刚在reddit上看到这个帖子，就知道马上要被公众号标题党霸占了头条，果然大家很喜欢看这种神坛跌落的故事，大概看了一下论文，其实确实说出了NLP用的这些DL模型的一些现状。去年用这个模型跑各种数据集的时候，也觉得很多东西不能理解，但是不得不承认，Bert的表现确实很好。

Reddit链接

BERT's success in some benchmarks tests may be simply due to the exploitation of spurious statistical cues in the dataset. Without them it is no better then random.

https://www.reddit.com/r/MachineLearning/comments/cfxpxy/berts_success_in_some_benchmarks_tests_may_be/

其实这类模型就是don't properly "understand" and only exploit (bad) statistical cues。——reddit

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

关于Bert被质疑利用“虚假统计性提示”的ACL论文的相关文章

在 model.fit() 期间记录 Keras 中每个时期的计算时间

我想比较不同模型之间的计算时间在拟合期间每个时期的计算时间被打印到控制台 Epoch 5 5 160000 160000 10s 我正在寻找一种方法来存储这些时间其方式与模型指标类似模型指标保存在每个时期并可通过历史对象获取尝试以
使用我自己的训练示例训练 spaCy 现有的 POS 标记器

我正在尝试在我自己的词典上训练现有的词性标注器而不是从头开始我不想创建一个空模型在spaCy的文档中它说加载您想要统计的模型下一步是使用add label方法将标签映射添加到标记器但是当我尝试加载英文小模型并添加标签图时
Keras，训练模型后如何预测？

我正在使用 reuters example 数据集它运行良好我的模型已经过训练我阅读了有关如何保存模型的信息以便稍后加载它以再次使用但如何使用这个保存的模型来预测新文本呢我用吗models predict 我必须以特殊方式准备这
如何使用keras打印神经网络中预测类的名称？

我在 keras 中使用预先训练的模型最终将类索引预测为一些整数值但我似乎不明白如何打印这些类的名称我使用的模型是 ResNet 50 看一下https martin thoma com image classification ht
如何更新反卷积层的权重？

我正在尝试开发一个反卷积层或者准确地说是转置卷积层在前向传递中我进行了完全卷积零填充卷积在向后传递中我进行有效的卷积没有填充的卷积以将错误传递到前一层偏差的梯度很容易计算只需对多余维度进行平均即可问题是我不知道如何更新
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
语音识别中如何处理同音词？

对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的我提供以下示例我们的是嗨和高到太二在使用时语音API https developer apple com docume
NLTK 中的无监督 HMM 训练

我只是想进行非常简单的无监督 HMM 训练nltk http www nltk org 考虑 import nltk trainer nltk tag hmm HiddenMarkovModelTrainer from nltk corpu
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
使用 Keras 的 ImageDataGenerator 预测单个图像

我对深度学习很陌生所以请原谅我这个可能很简单的问题我训练了一个网络来分类positive and negative 为了简化图像生成和拟合过程我使用了ImageDataGenerator和fit generator函数如下图 imp
具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中进行主题提取以便我能够根据主题获得情感我在用nltk在 python2 7 中用于此目的以下面的句子为例 Donald Trump is the worst president of USA but Hillary
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我

随机推荐

logback--进阶--05--自定义Appenders

logback 进阶 05 自定义Appenders 代码位置 https gitee com DanShenGuiZu learnDemo tree master logback learn 1 介绍 1 1 继承关系图可以看到Appe
C++ 多态和虚函数

一先搞清override overload overwrite的区别 1 overload 重载不是多态在C 程序中可以将语义功能相似的几个函数用同一个名字表示但参数不同包括类型顺序不同即函数重载 1 相同的范围在同一个
药明康德成都研发中心投入运营；中国白酒行业净利润将迎来七年来首次下滑

今日看点药明康德成都研发中心正式投入运营该研发中心将成为药明康德上海研发总部以外又一个覆盖化学及生物学的新药发现整体研发平台将为客户提供从小分子药物设计合成分析体内体外生物学肿瘤免疫学等全方位一体化的新药研发服务该研发中
【编译原理】LR(1)分析方法（c++实现）

前文回顾编译原理 LR 0 分析方法 c 实现编译原理 SLR 1 分析方法 c 实现算法来自龙书第二版代码和SLR的区别其实只是DFA中多了一个搜索符构建分析表的时候规约项的列是相应的搜索符而已代码基本上就在SLR的代码上
拼多多anti_content算法

最近拼多多的anti content算法更新了闲着无聊就看了看总思路如下首先我们抓包看到我们今天的目标 anti content 现在我们通过堆栈入口随便下个断点然后我们在CallStack中向下寻找经过漫长的寻找我们可以在
route命令的详细使用介绍

1 命令格式 route f p Command Destination mask Netmask Gateway metric Metric if Interface 2 命令功能 Route命令是用于操作基于内核ip路由表它的主要作用
es单机数据迁移到另一个es单机

将一个Elasticsearch单机的数据迁移到另一个Elasticsearch单机主要可以分为两步第一步备份原有数据将原有Elasticsearch单机中的数据备份到一个文件中可以使用 Elasticsearch 提供的 snap
第三十讲：神州路由器路由重分发配置

RIP和OSPF协议是目前应用最广泛的路由协议两种协议交接的场合也很多见两种协议的重分布是比较常见的配置主校区原来所采用的网络协议为OSPF 而分校区采用的路由协议是RIP 采用RIP和OSPF重分发技术可以解决此问题实验拓扑图如下
PostgreSQL、Greenplum 日常监控和维护任务

背景 Greenplum的日常监控点评判标准日常维护任务展示图层由于一台主机可能跑多个实例建议分层展示另外即使是ON ECS虚拟机一个虚拟机一个实例一对一的形态的产品形态实际上也建议分层展示以示通用性主机级图层 1
vue项目全局内引入外部CDN地址的js文件

通过vue cli 构建的vue项目的根目录下有一个index html文件例如
跳过selenium检测爬取淘宝直通车

最近有对阿里商家端进行一些数据爬取这次爬取的是直通车人群溢价数据发现对selenium的检测相当厉害然而我的回答是你强任你强清风拂山岗咱人工登录怕过谁什么cokies user agent selenium检测 token
Android构建问题解决方案

1 问题一解决方法在app下的build gradle中加上 packagingOptions exclude META INF DEPENDENCIES exclude META INF NOTICE exclude META INF
怎么计算union和struct中字节数计算

首先我的运行结果都是在64位系统的Xcode中运行的然后这个只是由于对于标准的位移量方法看得头疼自己总结出来的如果有错误或者不明欢迎留言字节一般成8位为一个字节在Xcode中sizeof int 等于4 在这里也就采用int占
fastjson（七）处理超大对象和超大JSON文本

当需要处理超大JSON文本时需要Stream API 在fastjson 1 1 32版本中开始提供Stream API 来看一下示例代码示例对象 package json fastjson StreamApi import java
java金额的正则表达式,【转】关于金额应验的Java方法（采用正则表达式）

public static boolean isNumber String str java util regex Pattern pattern java util regex Pattern compile 0 9 java util
2016阿里云121款产品和解决方案全向图（9月制）

2016阿里云121款产品和解决方案全向图 9月制摘要云栖社区在9月底又更新了 2016阿里云产品全向图和解决方案全向图导语 DT时代一切都将走向数据化可视化在阿里云所阐述的技术拓展商业的边界商业驱动技术的变革理念中密集
汇编语言（王爽第三版）实验5编写、调试具体多个段的程序

参考 http blog sina com cn s blog 171daf8e00102xclx html 汇编语言实验答案王爽 https wenku baidu com view a1cd7c6c1fb91a37f111f18583
muduo网络库学习笔记(13)：TcpConnection生命期的管理

本篇通过分析muduo中TcpConnection对断开连接事件的处理来学习muduo网络库对TcpConnection生命期的管理 TcpConnection对连接断开事件的处理首先我们来看一下TcpConnection处理连接断开
华为OD题目：整理扑克牌

package com darling boot order od od12 import java util 整理扑克牌题目描述给定一组数字表示扑克牌的牌面数字忽略扑克牌的花色请按如下规则对这一组扑克牌进行整理步骤1 对扑克牌
关于Bert被质疑利用“虚假统计性提示”的ACL论文

曾经狂扫11项记录的谷歌NLP模型BERT 近日遭到了网友的质疑该模型在一些基准测试中的成功仅仅是因为利用了数据集中的虚假统计线索如若不然还没有随机的结果好这项研究已经在Reddit得到了广泛的讨论引用自新智元真的不想那么标题

关于Bert被质疑利用“虚假统计性提示”的ACL论文

关于Bert被质疑利用“虚假统计性提示”的ACL论文 的相关文章

随机推荐

热门标签

关于Bert被质疑利用“虚假统计性提示”的ACL论文的相关文章