2021年10月中旬—字节AI LAB NLP算法面试题（一）

2023-11-20

问题一：bert的架构是什么目标是什么输入包括了什么三个embedding输入是怎么综合的？

Bert的结构主要是Transformer的encoder部分，其中Bert_base有12层，输出维度为768，参数量为110M，Bert_large有24层，输出维度为1024，参数总量为340M。

Bert的目标是利用大规模无标注语料训练，获得文本包含丰富语义信息的表征。

Bert的输入：token embedding，segment embedding，position embeddimg，三个向量相加作为模型的输入。

文末VIP会员、机械键盘、纸质书、硬盘等包邮送!

问题二： transformer里面每一层的主要构成有哪些

Transformer本身是一个典型的encoder-decoder模型，Encoder端和Decoder端均有6个Block，Encoder端的Block包括两个模块，多头self-attention模块以及一个前馈神经网络模块；

**Decoder端的Block包括三个模块，**多头self-attention模块，多头Encoder-Decoder attention交互模块，以及一个前馈神经网络模块；

需要注意：Encoder端和Decoder端中的每个模块都有残差层和Layer Normalization层。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

百度

自然语言处理

人工智能

机器学习

算法

2021年10月中旬—字节AI LAB NLP算法面试题（一）的相关文章

矩阵基本操作2

题目描述问题描述将方阵 n 行n列 n lt 100 置成下三角矩阵主对角线右上角数字全部清零输入格式第一行输入n 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式 n行n列下三角矩阵每个数字3个占位符左对齐输入样
基于opencv的大米计数统计（详细处理流程＋代码）

在我每周的标准作业清单中有一项是编写计算机视觉算法来计算该图像中米粒的数量因此当我的一个好朋友M给我发了一张纸上的扁豆照片显然是受到上述转发的启发请我帮他数一下谷物的数量时它勾起了我怀旧的回忆因此我在我的旧硬盘上寻找很久以前
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
性能大减80%，英伟达芯片在华“遇冷”，我方霸气回应：不强求

中国这么大一块市场谁看了不眼馋在科技实力大于一切的今天高端芯片的重要性不言而喻作为半导体产业发展过程中不可或缺的一环芯片技术也一直是我国技术发展的一大心病在美西方等国的联手压制下我国芯片技术发展处处受阻至今也未能在高端芯片
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
华为OD机试2024年最新题库（Java）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 Java 解法问
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
「优选算法刷题」：移动零

嗨这个假期罗根开始接触了算法在为今年的蓝桥杯做准备所以开个新专栏记录记录自己做算法题时的心得一题目给定一个数组 nums 编写一个函数将所有 0 移动到数组的末尾同时保持非零元素的相对顺序请注意必须在不复制数组的情况下
「优选算法刷题」：快乐数

一题目编写一个算法来判断一个数 n 是不是快乐数快乐数定义为对于一个正整数每一次将该数替换为它每个位置上的数字的平方和然后重复这个过程直到这个数变为 1 也可能是无限循环但始终变不到 1 如果这个过程结果为 1 那么这个
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
高精度运算合集，加减乘除，快速幂，详细代码，OJ链接

文章目录零前言一加法高精度加法步骤 P1601 A B 二减法高精度减法步骤
最大流-Dinic算法，原理详解，四大优化，详细代码

文章目录零前言一概念回顾可略过 1 1流网络 1 2流 1 3最大流 1 4残留网络 1 5增广路
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

快乐数(Java)

编写一个算法来判断一个数 num 是不是快乐数快乐数定义为对于一个正整数每一次将该数替换为它每个位置上的数字的平方和然后重复这个过程直到这个数变为 1 也可能是无限循环但始终变不到 1 如果可以变为 1 那么这个数就是快乐数
瀑布流布局2

要实现瀑布流布局中让图片先排满第一行再排第二行你可以使用 CSS 的多列布局 CSS multi column layout 来控制目前你的布局使用了 column count 和 column gap 来定义列数和列之间的间隙但这会
记一次ElasticSearch 更改 mapping 字段类型的过程

我的个人博客逐步前行STEP 首先 es不支持直接更改mappinng 所以更改 mapping 实质上是重建索引操作步骤如下 1 为当前这个索引old index设置一个别名my index curl XPOST localhost
数据类型分类

分为四种类型
Java垃圾回收机制（GC）

一要回收哪些区域在JVM内存模型中有三个是不需要进行垃圾回收的程序计数器 JVM栈本地方法栈因为它们的生命周期是和线程同步的随着线程的销毁它们占用的内存会自动释放所以只有方法区和堆需要进行GC 二如何判断对象是否存活 1
linux 开放端口

我们可以输入命令查看防火墙的状态 firewall cmd state 如何在CentOS 7下开放8080端口如果上一步处于关闭状态输入命令 systemctl start firewalld service 如何在CentOS 7下
计算机毕业设计Node.js+Vue大型零售电商平台——购物车管理子系统（程序+源码+LW+部署)

该项目含有源码文档程序数据库配套开发软件软件安装教程欢迎交流项目运行环境配置 Node js Vscode Mysql5 7 HBuilderX Navicat11 Vue Express 项目技术 Express框架 No
华硕T100HA鼠标乱跳及点击问题解决

从入手此平板开始就一直有此问题一直没有解决今天正好装系统就顺便解决此问题一开始打算给这个平板安装Win7 8 网上说装了之后驱动不适配就此放弃然后将系统恢复出厂设置了然后问题依然在在网上一直找啊找终于在百度帖吧里找到问题
人工智能概念

人工智能概念人工智能就是用人工方法在机器计算机上实现的智能或称机器智能即是研究如何用计算机来表示和执行人类的智能活动以模拟人脑所从事的推理学习思考和规划等思维活动并解决需要人类的智力才能处理的复杂问题如医疗诊断管理决策
两个任意长度的长整数相乘（华为oj，C++）

pre class cpp include oj h include pre
【Android系统蓝牙开发】蓝牙基础知识-蓝牙核心系统架构

什么是蓝牙在开启基于蓝牙Spec v5 2的学习前我们先了解下什么是蓝牙蓝牙在我们日常生活中又存在哪些实际应用呢蓝牙无线技术是一种短距离无线通信系统其核心特性主要是以下三点 robustness 鲁棒性抗干扰能力强 Low po
Python入门—— MySQL-python模块

MySQL python模块 MySQLdb Python 标准数据库接口为 Python DB API Python DB API为开发人员提供了数据库应用编程接口可以访问Python数据库接口及API查看详细的支持数据库列表不同的数
Hadoop3 启动服务，提示：Attempting to operate on hdfs namenode as root

在刚刚安装Hadoop3 环境上启动Hadoop3 给出如下提示信息 Attempting to operate on hdfs namenode as root 翻译尝试使用root 账户去操作hdfs namenode 造成原因缺
IEEE 1588-PTP简介

1 PTP简介网络测控系统精确时钟同步协议PTP Precision Time Protocol 是一种对标准以太网终端设备进行时间和频率同步的协议也称为IEEE 1588 简称为1588 1588分为1588v1和1588v2两个版本
树莓派4B安装详细教程，从零开始！

树莓派4B安装详细教程从零开始前言一准备材料 1 硬件材料 2 软件材料二安装步骤 1 格式化SD卡 2 安装系统三安装完成前言提示本文详细介绍树莓派4B的安装流程适合刚入手树莓派的同学认为我写的好的同学希望点赞关
xxx-0.0.1-SNAPSHOT.jar中没有主清单属性

添加如下配置即可
算法通关村——二分查找在寻找数组峰顶中的应用

题目在数组i的某个位置i 开始从 0 到 i 都是递增的从 i 1 都是递减的请你找到这个最高点方法一使用线性遍历实现分析最高点如果存在需要满足arr i 1 lt arr i gt arr i 1 又因为题目说了0到i就
史上最全的Android面试题集锦

前言很多人面试之前可能没有在互联网公司工作过或者说工作过但年头较短不知道互联网公司技术面试都会问哪些问题再加上可能自己准备也不充分去面试没几个回合就被面试官几个问题打蒙了最后以惨败收场下述是我收录整理的Android面试题汇总
解决Photoshop无法完成请求，因为找到不知名的或无效的JPEG标识符类型问题

在我将用微信Alt A截的图到Photoshop的时候出现无法完成请求因为找到不知名的或无效的JPEG标识符类型问题如下图解决办法是右击图片用画图打开图片将图片另存为jpg格式或者png格式即可再次导入即可成功具体原因不详
2021年10月中旬—字节AI LAB NLP算法面试题（一）

问题一 bert的架构是什么目标是什么输入包括了什么三个embedding输入是怎么综合的 Bert的结构主要是Transformer的encoder部分其中Bert base有12层输出维度为768 参数量为110M Bert

热门标签