网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条

2023-11-14

作者 | 陈大鑫、陈彩娴 

来源 | AI科技评论


昨晚脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型

什么是lite模型?

该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。

当晚全公司通报,直接被列入 P0 事故等级(严重事故):

据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:

大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:

所以说一定要稳住别慌,问题不大。

 

1

网友热议

有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。

还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。

我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。

而别的对手就权限不一了。

到底删除了多少模型?

根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。

又有字节的工程师网友表示删除的都是离线数据,影响不大。

该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。

实习生“立大功”

2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。

2

字节 AI 

字节都有什么出名的机器学习产品?

字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。

此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。

据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。

据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。

LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。

相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:1. 高性能;2. 支持模型功能多; 3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。

据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。

最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。

或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。

虽说如此,但程序里的bug是个玄学,有时哪怕某个小bug产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。

但是,还是希望各位公司谨记「天干物燥,小心火烛」。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条 的相关文章

随机推荐

  • 双线macd指标参数最佳设置_15分钟macd参数设置方法 15分钟k线macd指标如何判断买卖点...

    炒股投资过程中 我们通常会借助多种指标来判断股票买卖时机 今天为大家分享判断股票买卖点的组合是15分钟k线与macd指标 那么15分钟macd参数设置方法是什么 15分钟k线macd指标如何判断买卖点 下面小编为大家来详细介绍下15分钟线m
  • 网络穿透代理局域网

    网址 穿透网址 开启通道 开始代理
  • ARM中的---汇编指令

    一 带点的 一般都是ARM GNU伪汇编指令 1 text data bss 依次表示的是 以下是代码段 以下是初始化数据段 以下是未初始化数据段 2 global 定义一个全局符号 通常是为ld使用 比如经常看到的 global star
  • 利用树莓派搭建简易服务器

    读研以来笔者一直负责实验室的网络维护 可以说是实验室名副其实的首席大网管 整个实验室是从学校网络中心购买了一个教育网的公网IP地址和带宽 公网IP绑定了实验室的主路由器 而主路由器就在笔者卡位的旁边 有一天笔者突发奇想 拿了手头的树莓派3结
  • Micropython——报错解决:TypeError: object with buffer protocol required

    报错 检查报错处代码 仔细检查可以发现 是括号放错位置 导致函数无法正常执行 故报错 一般情况下 Micropython除硬件如定时器中断内存溢出等硬件本身报错外 其他均为语法错误
  • 统计学习方法学习笔记(一)————统计学习方法概论

    1 统计学习 1 统计学习概念 统计学习 statistical learning 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科 统计学习也称为统计机器学习 statistical machine learn
  • MLIR入门系列系列学习笔记

    目录 1 名字解释 这一定义包含3个关键元素 2 代码演示 2 1 环境准备 2 2 编译llvm project 2 3 测试解析 2 3 1 源程序 2 3 2 将源程序生成抽象语法树 AST 3 MLIR三要素 3 1 MLIRGen
  • 为什么在组件内部data是一个函数而不是一个对象?

    为什么在组件内部data是一个函数而不是一个对象 因为在组件复用的时候会重新生成一个对象 而data是一个对象的话 因为对象是引用数据类型 data数据会被复用 而当data是一个函数的时候每次调用的时候就会返回一个新的data对象 vue
  • 安装--centos7上使用kubeadm安装三节点的k8s集群

    安装文档 https kubernetes io zh cn docs setup production environment tools kubeadm install kubeadm 参考 https blog csdn net qq
  • 瑞吉外卖业务开发

    一 软件开发整体介绍 软件开发流程 需求分析 产品原型 需求规格说明书 设计 产品文档 UI界面设计 概要设计 详细设计 数据库设计 编码 项目代码 单元测试 测试 测试用例 测试报告 上线运维 软件环境安装 配置 角色分工 项目经理 对整
  • 2023华为OD机试真题【垃圾短信识别】

    题目描述 大众对垃圾短信深恶痛绝 希望能对垃圾短信发送者进行识别 为此 很多软件增加了垃圾短信的识别机制 经分析 发现正常用户的短信通常具备交互性 而垃圾短信往往都是大量单向的短信 按照如下规则进行垃圾短信识别 本题中 发送者A符合以下条件
  • unity3d FPS 枪的后座力

    实现枪开枪后 向上偏移一段距离 再缓慢下移复位 模仿cs 调小后座力 using UnityEngine using System Collections public class Camera2Follower MonoBehaviour
  • Linux驱动开发--平台总线id和设备树匹配

    目录 一 ID匹配之框架代码 二 ID匹配之led驱动 三 设备树匹配 四 设备树匹配之led驱动 五 一个编写驱动用的宏 一 ID匹配之框架代码 id匹配 可想象成八字匹配 一个驱动可以对应多个设备 优先级次低 注意事项 device模块
  • 学会QT从这里开始——教你快速学会QT

    为了提高提高推文质量 最近又再翻看QT书籍 不知道大家有没有发现 QT书籍大多都是从环境 安装 控件开始讲解 好 现在开始学习吧 1 环境安装 2 新建项目 3 学习控件 QButton QLable QLineEdit QTextEdit
  • nacos2.2.1集成达梦数据库

    nacos2 2 1集成达梦数据库 1 下载源码 https github com alibaba nacos 2 新增达梦驱动依赖 父pom xml
  • openwrt篇修改WiFi热点默认名称和主机名

    在如下图文件中 修改ssid 在如下图文件中修改hostname
  • Linux的用户空间与内核空间

    一 简介 Linux 操作系统和驱动程序运行在内核空间 应用程序运行在用户空间 两者不能简单地使用指针传递数据 因为Linux使用的虚拟内存机制 用户空间的数据可能被换出 当内核空间使用用户空间指针时 对应的数据可能不在内存中 用户空间的内
  • vue3项目引入高德地图详细方法教程

    项目需求需要引入地图 对于目前最新的Vue3 0 无论是百度 高德 腾讯地图目前还没有适配 只有Vue 2 x版本的 目前只有谷歌地图的Vue3 0适配 但是没有适配并不代表不能使用 下面就来教大家如何使用 1 在高德开发平台申请你的key
  • react定义函数,默认函数参数的方式

    参数是 对象 有传入参数用传入参数作为入参数 无传入参数用默认值 getTableData async pageData gt const params Object assign currPage 1 pageSize this stat
  • 网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条

    作者 陈大鑫 陈彩娴 来源 AI科技评论 昨晚脉脉上有网友爆料 字节跳动一位实习生删除了公司所有轻量级别的机器学习模型 什么是lite模型 该楼主表示 lite模型就是公司内几乎所有GB大小以下的机器学习模型 且全部被删除了 实习生直接删除