字节跳动P0级事故:实习生删除GB以下所有模型,直接上了今日头条......

2023-11-06

大家好,我是小猿。

曾经我招过一个实习生,他曾经干过一件让我感到匪夷所思的事:

我当时忙,让他把服务器重启,他直接来了个电源重启。

1e99f7bc1c6679e1754051b0e6864020.png341c02fc6010714b31faa0d7e43ed02e.png627834d48db62d9be0ef963f0aef6a9d.png

最近脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型60bd999acb3e16b73a37cd7f8a1ef7a5.png

e7776be45cab9651d5d6847b5a2f25f3.png

3e0e81cbb822f56185601d57f7c59238.png

什么是lite模型?

该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。

78d24b2504fe4413f46ae07067f29ff6.png

当晚全公司通报,直接被列入 P0 事故等级(严重事故):

69c8f025d5f64de5e679d8bc26f31d8b.png

据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:

f78be1cada45651a13951ce1c268be8b.png

大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:

462fc589cc7723765d6bb67b7f1520cb.png

所以说一定要稳住别慌,问题不大。

48aca41aaf5e5095a7bad03eed2bebdf.png

1

网友热议

有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。

accdf0e0d1d1042c39997b32683a0492.png

还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。

11e9f89bc3a1ab1e8c0f1c8e05c0d944.png

我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。

eb2b8c20ab7e1e024854d17687bd0d1d.png

而别的对手就权限不一了。

9d6b859dbedddbd6ed330b2f34faaecf.png

54910ad970eec6c47abff7ec1fea1add.png

到底删除了多少模型?

根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。

462654947bd1d8ab8b72d30264641e80.png

又有字节的工程师网友表示删除的都是离线数据,影响不大。

该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。

c7be15ce75baadd4050a46aba6b4fed8.png

实习生“立大功”

a0dab63699c39a2a05380a2fbc62eb0a.png

2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。

2

字节 AI 

字节都有什么出名的机器学习产品?

字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。

此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。

0a978256a69be24e1d6a4bfd5230e67e.png

据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。

据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。

899c3ae0c79b65941d1b029bc76c33b2.png

LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。

相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:1. 高性能;2. 支持模型功能多;3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。

据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。

最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。

或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。

1f8a6a760241f6d1892a85dc94c9dec1.png

虽说如此,但程序里的bug是个玄学,有时哪怕某个小bug产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。

来源:https://www.codingsky.com/news/2021-06-24/114315.html

最后,给大家赠送一台华硕轻薄笔记本,不想要实物的话可以折现。扫码关注公众号:Java后端编程,回复关键词:抽奖

b92910ace485abe5e1090ed015324b46.png

5e4a9e7860bf65a9235fa6b504273b10.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

字节跳动P0级事故:实习生删除GB以下所有模型,直接上了今日头条...... 的相关文章

  • 热重载在docker中运行的java程序

    我开发了一个java程序 应该在docker中运行 然而 我在调试docker中运行的java程序时遇到了很多痛苦 我在网上搜索 一些教程提出了像 spring dev tools 这样的工具 因为我的java程序是基于spring boo
  • 如果测试用例失败,Selenium Web 驱动程序无法关闭 Firefox 实例

    我各位 我正在使用 junit 和 selenium web 驱动程序 2 28 问题是 如果我运行成功的测试用例 Web 驱动器能够关闭 Firefox 实例 但是当测试用例失败时 Selenium Web 驱动器无法关闭 Firefox
  • 如何在 JFace 的 TableViewer 中创建复选框?

    我创建了一个包含两列的 tableViewer 我想将其中一列设为复选框 为此 我创建了一个 CheckBoxCellEditor 但我不知道为什么它不起作用 名为 tableName 的列显示其值正常 色谱柱规格如下 String COL
  • java.io.IOException: %1 不是有效的 Win32 应用程序

    我正在尝试对 XML 文档进行数字签名 为此我有两个选择 有一个由爱沙尼亚认证中心为程序员创建的库 还有一个由银行制作的运行 Java 代码的脚本 如果使用官方 认证中心 库 那么一切都会像魅力一样进行一些调整 但是当涉及到银行脚本时 它会
  • 当分配给变量时,我可以以某种方式重用 Gremlin GraphTraversals 代码吗?

    我有看起来像这样的 GraphTraversals attrGroup GraphTraversal
  • Microsoft Graph 身份验证 - 委派权限

    我可以使用 Microsoft Graph 访问资源无需用户即可访问 https developer microsoft com en us graph docs concepts auth v2 service 但是 此方法不允许我访问需
  • 请求位置更新参数

    这就是 requestLocationUpdates 的样子 我使用它的方式 requestLocationUpdates String provider long minTime float minDistance LocationLis
  • Clip 在 Java 中播放 WAV 文件时出现严重延迟

    我编写了一段代码来读取 WAV 文件 大小约为 80 mb 并播放该文件 问题是声音播放效果很差 极度滞后 你能告诉我有什么问题吗 这是我的代码 我称之为doPlayJframe 构造函数内的函数 private void doPlay f
  • 序列化对象以进行单元测试

    假设在单元测试中我需要一个对象 其中所有 50 个字段都设置了一些值 我不想手动设置所有这些字段 因为这需要时间而且很烦人 不知何故 我需要获得一个实例 其中所有字段都由一些非空值初始化 我有一个想法 如果我要调试一些代码 在某个时候我会得
  • 检查 Android 手机上的方向

    如何查看Android手机是横屏还是竖屏 当前配置用于确定要检索的资源 可从资源中获取Configuration object getResources getConfiguration orientation 您可以通过查看其值来检查方向
  • 应用程序关闭时的倒计时问题

    我制作了一个 CountDownTimer 代码 我希望 CountDownTimer 在完成时重新启动 即使应用程序已关闭 但它仅在应用程序正在运行或重新启动应用程序时重新启动 因此 如果我在倒计时为 00 10 分钟 秒 时关闭应用程序
  • 使用 SAX 进行 XML 解析 |如何处理特殊字符?

    我们有一个 JAVA 应用程序 可以从 SAP 系统中提取数据 解析数据并呈现给用户 使用 SAP JCo 连接器提取数据 最近我们抛出了一个异常 org xml sax SAXParseException 字符引用 是无效的 XML 字符
  • Android JNI C 简单追加函数

    我想制作一个简单的函数 返回两个字符串的值 基本上 java public native String getAppendedString String name c jstring Java com example hellojni He
  • Springs 元素“beans”不能具有字符 [children],因为该类型的内容类型是仅元素

    我在 stackoverflow 中搜索了一些页面来解决这个问题 确实遵循了一些正确的答案 但不起作用 我是春天的新人 对不起 这是我的调度程序 servlet
  • 查看Jasper报告执行的SQL

    运行 Jasper 报表 其中 SQL 嵌入到报表文件 jrxml 中 时 是否可以看到执行的 SQL 理想情况下 我还想查看替换每个 P 占位符的值 Cheers Don JasperReports 使用 Jakarta Commons
  • 将2-3-4树转换为红黑树

    我正在尝试将 2 3 4 树转换为 java 中的红黑树 但我无法弄清楚它 我将这两个基本类编写如下 以使问题简单明了 但不知道从这里到哪里去 public class TwoThreeFour
  • com.jcraft.jsch.JSchException:身份验证失败

    当我从本地磁盘上传文件到远程服务器时 出现这样的异常 com jcraft jsch JSchException Auth fail at org apache tools ant taskdefs optional ssh Scp exe
  • java8 Collectors.toMap() 限制?

    我正在尝试使用java8Collectors toMap on a Stream of ZipEntry 这可能不是最好的想法 因为在处理过程中可能会发生异常 但我想这应该是可能的 我现在收到一个我不明白的编译错误 我猜是类型推理引擎 这是
  • javax.persistence.Table.indexes()[Ljavax/persistence/Index 中的 NoSuchMethodError

    我有一个 Play Framework 应用程序 并且我was使用 Hibernate 4 2 5 Final 通过 Maven 依赖项管理器检索 我决定升级到 Hibernate 4 3 0 Final 成功重新编译我的应用程序并运行它
  • Swagger/Openapi-Annotations:如何使用 $ref 生成 allOf?

    我正在生成 Rest 端点 包括添加OpenAPI Swagger对生成的代码进行注释 虽然它对于基本类型运行得很好 但我在自定义类方面遇到了一些问题 现在我有很多自定义类的重复架构条目 使用 Schema 实现 MyClass class

随机推荐

  • git push -u origin master提示 fatal: repository 'https://gitlab.com/xx.git/' not found

    正解 1 git remote set url origin https gitlab用户名 gitlab com xx demo git 2 git push u origin master 会提示输入密码 输入入正确的gitlab密码即
  • Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.

    data self reader read nrows File pandas libs parsers pyx line 796 in pandas libs parsers TextReader read File pandas lib
  • dl_iterate_phdr

    http www helplib net s linux die 65 1099 man 3 dl iterate phdr shtml http linux die net man 3 dl iterate phdr dl iterate
  • 跨域错误问题has been blocked by cors policy

    这个问题其实是一个跨域调用错误 有多种解决方法 我放到服务器上所以在服务器上的apache的配置文件中修改 一开始以为apache的配置文件是httpd conf 然后发现我压根没有这个文件 在 etc apache2 apache2 co
  • 单手杀穿经典链表题Pt.1——LeetCode天梯渡劫(移除节点,反转链表,中间节点)

    目录 传统艺能 移除链表元素 反转链表 链表的中间结点 传统艺能 小编是双非本科大一菜鸟不赘述 欢迎大佬指点江山 QQ 1319365055 此前博客点我 点我 请搜索博主 知晓天空之蓝 乔乔的gitee代码库 打灰人 欢迎访问 点我 非科
  • 终端配色-Docker容器终端

    20230309 0 引言 平时使用SSH 通常都是使用securecrt来用 毕竟也算是之前windows下一种使用的工具 在mac下使用还算方便 进入终端后 可以通过调整配色来调整编程环境 平时经常使用屎黄色的那种配色 毕竟柔和 偶尔使
  • 计算机的快速启动栏,电脑快速启动栏不见了

    文章目录导航 演示系统及适用范围 演示系统 XP专业版 Windows2003企业版 WIN7旗舰版 适用范围 XP各版本 WIN2003 WIN2008及WIN7各版本系统 xp找回快速启动栏方法 不管是XP或是Winserver2003
  • conda修改环境保存地址

    可以在命令行中通过conda config指令进行修改 如 添加环境目录envs dirs conda config add envs dirs F conda env envs 添加pkgs dirs conda config add p
  • MVC模式、MVVM模式及其区别

    文章目录 MVC模式 MVVM模式 MVVM优点 MVC与MVVM的区别 MVC模式 MVC是应用最广泛的软件架构之一 一般MVC分为 Model 模型 View 视图 Controller 控制器 这主要是基于分层的目的 让彼此的职责分开
  • BUUCTF刷题记录(6)

    文章目录 web FBCTF2019 RCEService GYCTF2020 FlaskApp CISCN2019 华北赛区 Day1 Web5 CyberPunk BSidesCF 2019 Futurella CISCN2019 华东
  • 【STM32技巧】ADC模拟量采集的几种用法

    1 AD单次转换 软件启动 通过程序启动AD AD采集一次 我们就去读一次 这种情况 建议开启AD转换完成中断 在中断中读出AD值并做处理 初始化的时候 启动一次 然后在主循环里 每隔一秒启动一次 在中断回调函数里 进行相关处理 电脑输出如
  • python实现交换排序

    排序算法 python实现基数排序 python实现归并排序 python实现交换排序 python实现选择排序 python实现插入排序 冒泡排序 基本思想 假设待排序表长为n 从后往前或者从前往后两两比较相邻元素的值 若为逆序则交换它们
  • fatal: Authentication failed for又不弹出用户名和密码 解决办法

    各位 如果能弹出来 一定是你账号密码搞错了 就别继续看了 image png 切换命令行 image png 依然报错 说到这个问题 又可以长篇大论了 我使用的是tortoisegit window电脑平常都是用ppk文件组合 netrc文
  • 51单片机---IE寄存器,TCON寄存器,TMOD寄存器

    寄存器IE 中断允许寄存器IE的作用 是控制所有中断源的开放或禁止 以及每个中断源是否被允许 寄存器IE的位格式如下 EX0 外部中断0允许位 EX0 1 允许外部中断0中断 EX0 0 禁止外部中断0中断 ET0 T0溢出中断允许位 ET
  • KNN学习之图像分类与KNN原理

    点击上方 小白学视觉 选择加 星标 或 置顶 重磅干货 第一时间送达 简介 KNN算法 即K近邻算法是一种监督学习算法 本质上是要在给定的训练样本中找到与某一个测试样本A最近的K个实例 然后统计k个实例中所属类别计数最多的那个类 就是A的类
  • Java进阶(2) - 特殊对象(Class类)

    存在的意义位于java lang包下 和java lang reflect包下的类共同支持java反射功能jvm在类加载时 在堆中为每个类生成一个Class对象 用于记录每个类的属性 方法等信息 同时每个对象生成时都有特殊的标记位来指向堆中
  • js预编译习题解题思路

    js预编译习题解题思路 function fn a c console log a function a var a 123 console log a 123 console log c function c function a if
  • Linux知识概括

    Linux知识概括 Linux介绍 VMware工具与远程登录 Linux目录结构 Vi和Vim编辑器 开关机与登录注销与用户管理 Linux常用系统文件 实用指令 其他常用指令 帮助指令 文件目录类 时间日期类 搜索查找类 压缩和解压类
  • Spring AOP如何使用AspectJ注解进行开发呢?

    转自 Spring AOP如何使用AspectJ注解进行开发呢 下文讲述Spring AspentJ中采用注解的方式定义切面 切入点和增强处理的示例 Annotation注解 注解名称 备注 Aspect 用于定义一个切面 Pointcut
  • 字节跳动P0级事故:实习生删除GB以下所有模型,直接上了今日头条......

    大家好 我是小猿 曾经我招过一个实习生 他曾经干过一件让我感到匪夷所思的事 我当时忙 让他把服务器重启 他直接来了个电源重启 最近脉脉上有网友爆料 字节跳动一位实习生删除了公司所有轻量级别的机器学习模型 什么是lite模型 该楼主表示 li