如何使用 BERT 进行机器翻译?

2024-01-06

我遇到了一个大问题。对于我的学士论文,我必须使用 BERT 制作一个机器翻译模型。 但我现在一事无成。 您知道可以在这里帮助我的文档或其他东西吗? 我已经阅读了一些这方面的论文,但也许有文档或教程可以帮助我。

对于我的学士论文,我必须将文本摘要翻译成标题。 我希望有一个人可以帮助我。


BERT 不是机器翻译模型,BERT 旨在提供对各种 NLP 任务有用的上下文句子表示。尽管存在将 BERT 纳入机器翻译的方法(https://openreview.net/forum?id=Hyl7ygStwB https://openreview.net/forum?id=Hyl7ygStwB),这不是一个简单的问题,人们怀疑它是否真的能带来回报。

从你的问题来看,看来你并不是真正的机器翻译,而是自动摘要。与机器翻译类似,可以使用序列到序列模型来实现,但我们在 NLP 中不称其为翻译。 对于序列到序列建模,有不同的预训练模型,例如BART https://arxiv.org/abs/1910.13461 or MASS https://arxiv.org/abs/1905.02450。这些应该比 BERT 有用得多。


2022年9月更新:有多语言的类似BERT的模型,最著名的是多语言 BERT https://huggingface.co/bert-base-multilingual-cased and XLM-罗伯塔 https://huggingface.co/xlm-roberta-base。经过仔细微调后,它们可以用作机器翻译的通用编码器,并实现所谓的零样本机器翻译。该模型经过训练可以从多种源语言翻译成英语,但最终它可以翻译多语言 BERT 类模型涵盖的所有语言。该方法称为SixT https://arxiv.org/abs/2104.08757v1.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 BERT 进行机器翻译? 的相关文章

  • 如何从命令行启动 jupyter Notebook 以在当前目录中运行,而无需编辑配置文件或传递硬路径?

    Jupyter Notebook 目前有一个限制 在当前目录中启动终端 https github com jupyter notebook issues 2018 我如何从命令行执行此操作 没有 Anaconda 或其他 GUI witho
  • 运行 IPython 笔记本时如何(间歇性地)跳过某些单元格?

    重新打开笔记本时 我通常必须重新运行笔记本 的大部分部分 以便访问先前定义的变量并继续工作 然而 有时我想跳过一些单元格 这些单元格对后续单元格没有影响 例如 它们可能包含已完成的分析分支 并且可能需要很长时间才能运行 这些单元格可能分散在
  • 从数据框中删除所有非唯一行

    抱歉 这是我的第二篇文章 如果有什么不明白的地方请告诉我 我正在尝试删除所有有重复项的行 我已经尝试过keep False参数为drop duplicates 它只是没有做正确的事情 假设我的数据框看起来像这样 ORDER ID ITEM
  • ipython 笔记本的 TOC 扩展发生了什么?

    我正在尝试在新计算机上安装出色的目录扩展 但我再也找不到了 唯一的页面我确实发现 https github com minrk ipython extensions没有解释如何在 Windows 上安装扩展 那么 我该如何安装它 为什么它不
  • 获取整个 Jupyter Notebook 的当前内容

    我有一个正在运行的 Jupyter Notebook 我希望能够从 Python 中访问当前 Jupyter Notebook 的源代码 我的最终目标是将其传递到ast parse这样我就可以对用户的代码进行一些分析 理想情况下 我能够做这
  • 保存 Jupyter Notebook,并显示 Plotly Express 小部件

    我有一个 Jupyter 笔记本 python 我使用plotlyexpress 在笔记本中绘图以进行分析 我想与非编码人员共享此笔记本 并让交互式视觉效果仍然可用 但它似乎不起作用 我尝试以下此处提出的建议 https community
  • Julia 1.6.2 未出现在 Jupyter 笔记本中

    我已经根据这个网站安装了 julia 1 6 2 jupyter notebook 和 anaconda 3 https datatofish com add julia to jupyter https datatofish com ad
  • 如何为 pandas 列的每组创建子图

    在泰坦尼克号数据集中 我需要创建一个图表来显示所有舱位幸存者的乘客百分比 它还应该有三个饼图 1 级幸存和未幸存 2 级幸存和未幸存 3 级 如何才能实现这一点呢 我已经尝试过这种类型的代码 但它会产生错误的值 import pandas
  • BERT 输出不确定

    BERT 输出是不确定的 当我输入相同的输入时 我希望输出值是确定性的 但我的 bert 模型的值正在变化 听起来很尴尬 同一个值返回两次 一次 也就是说 一旦出现另一个值 就会出现相同的值并重复 如何使输出具有确定性 让我展示我的代码片段
  • Jupyter笔记本情节不显示图表..(仅图表)[重复]

    这个问题在这里已经有答案了 在 jupyter 笔记本中 我的代码确实运行 只是不显示图形 我尝试过很多方法 我的示例代码 图片 我的代码和图片 import plotly offline as pyo import plotly grap
  • AWS Glue 3.0 容器不适用于 Jupyter 笔记本本地开发

    我正在 AWS 中开发 Glue 并尝试在本地开发中进行测试和调试 我按照这里的说明进行操作https aws amazon com blogs big data developing aws glue etl jobs locally u
  • 更改 IPython 笔记本小部件中标签的大小

    这确实是一个小问题 但仍然很烦人 我正在编写一个工具 允许用户设置一堆数字参数以在 IPython 笔记本中进行分析 我把它设置为一堆FloatTextWidgets in a ContainerWidget 它们有相当长的标签 例如 姿势
  • 在不同的 GPU 上同时训练多个 keras/tensorflow 模型

    我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型 我正在使用 4GPU 的节点上工作 我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型 现在 我通过 例如 为一台笔记本选择 GPU import
  • jupyter 中的 r 图形 - 无法启动 png() 设备

    我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表 这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
  • Jupyter Notebook 中的深色模式绘图 - Python

    我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题 我注意到我的绘图不是处于黑暗模式 并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
  • Jupyter 笔记本中未显示绘图图表

    我已经尝试解决这个问题几个小时了 我按照上面的步骤操作情节网站 https plot ly python getting started start plotting online并且图表仍然没有显示在笔记本中 这是我的情节代码 color
  • 如何在 Jupyter Notebook 中运行 Python 异步代码?

    我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好 我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它 我可以运行它 import asyncio asyncio get ev
  • ipython 笔记本锚链接直接从外部引用单元格

    我正在为基于笔记本的框架编写文档 当引用演示笔记本中的重要单元格时 我可以使用某种锚点来指向特定单元格吗 例如 如果我的演示笔记本位于 127 0 0 1 mydemo 是否可以通过某些锚标记 如 127 0 0 1 mydemo In10
  • BertForSequenceClassification 是否在 CLS 向量上进行分类?

    我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
  • 在服务器上安装 Anaconda

    我有一个 Unix 服务器 其中安装了 Python3 我从我的 mac ssh 到服务器 我想知道是否可以在服务器上安装 Anaconda 和 Jupyter Anaconda 附带 这样我就可以在服务器终端上拉起 Jupyter 并在服

随机推荐