fairseq常用的命令行参数

2023-10-29

fairseq-train

--tensorboard-logdir   #可视化训练过程
--keep-last-epochs 10  # 默认保存最后10个epoch
--eval-bleu            # 在验证阶段评估bleu
--eval-bleu-args '{"beam": 5, "max_len_a": 1.2, "max_len_b": 10}'      # 评估bleu的参数
--eval-bleu-detok moses   # 验证阶段时使用moses工具来进行detokenize
--eval-bleu-remove-bpe  # 在验证阶段评估bleu时 remove-bpe
--best-checkpoint-metric bleu # 选择best-checkpoint的策略，默认是loss最低，这里使用bleu
--maximize-best-checkpoint-metric  # 最大化选择best-checkpoint的策略，在使用bleu时使用
--patience 10  			# 如果连续10次验证运行的有效性能没有提高，则提前停止训练

fairseq-generate

--beam 5  # 解码时beam search设置为5
--remove-bpe # 生成remove bpe之后的结果
--scoring sacrebleu  # 默认使用bleu
--sacrebleu   # 效果同上
--quiet       # 只打印最终成绩

fairseq-score

-s, --sys   # 机器翻译模型的输出
-r, --ref   # 目标语句
-o, --order  # n-gram的阶数，默认为4
--ignore-case   # 大小写敏感的分数
--sacrebleu     # 使用sacrebleu
--sentence-bleu    # 报告句子级别的BLEU

fairseq-interactive

--path    # 模型checkpoint的路径
data
--beam    # beam size
--source-lang  # 源语言类型
--target-lang  # 目标语言类型
--tokenizer    # 使用的tokenizer，可以选择使用 moses、nltk和space
--bpe          # 使用的bpe，可以选择用 byte_bpe、bytes、characters、fastbpe、gpt2、bert、hf_byte_bpe、sentencepiece、 subword_nmt
--bpe-codes   # 指定训练得到的bpe-codes
--max-len-a   # 生成的最大长度为 ax+b(x是源序列长度)，这里指定a，默认为0
--max-len-b   # 生成的最大长度为 ax+b(x是源序列长度)，这里指定b，默认为200
--min-len     # 最小生成长度，默认为1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

自然语言处理

Pytorch

fairseq常用的命令行参数的相关文章

Win10 64位上CUDA 12的PyTorch安装

我需要在我的 PC 上安装 PyTorch 其 CUDA 版本 12 0 pytorch 2 的表 https i stack imgur com X13oS png in In 火炬网站 https pytorch org get sta
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
预训练 Transformer 模型的配置更改

我正在尝试为重整变压器实现一个分类头分类头工作正常但是当我尝试更改配置参数之一 config axis pos shape 即模型的序列长度参数时它会抛出错误 Reformer embeddings position embeddin
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔

随机推荐

TypeError: this.getOptions is not a functionj解决方案

遇到的问题在使用react搭建项目在配置less的时候一直报如下错误我以为webpack配置错了尝试了很多办法最终找到了原因 less loader版本过高解决方案 1 npm uninstall less loader 2 n
vwware docker安装seata

参考 docker安装seata
vue Mac环境下npm run serve提示 node_modules/.bin/vue-cli-service: Permission denied

Mac环境下使用 npm run dev 命令运行 Vue 项目时报错 no such file or directory open package json 但是明明项目中有package json这个文件如下图问题一般这种情
java 泛型 class< >_Java中泛型T和Class以及Class的理解（轉）

注意 class是java的關鍵字在聲明Java類時使用 Class類的實例表示Java應用運行時的類 class ans enum 或接口 interface and annotation 每個Java類運行時都在JVM里表現為一個Cl
STM32 复位时钟控制—RCC

时钟分为系统时钟外设时钟我们今天来看一下系统时钟 stm32的系统时钟由固件库配置好不需要修改我们了解认识一下并学会修改使用目录 1 系统时钟介绍 8个部分 2 程序分析 1 用HSE配置系统时钟 2 用HIS配置系统时钟下图
Docker容器连不了网的一种解决方式

问题分析首先容器在之前用到过联网也没有问题我这边使用的还是容器内固定ip 所以问题肯定是后面才出现的容器本身没有做任何改变解决方式如果你跟我一样 docker容器是突然访问不了网包括容器内访问外网宿主机访问容器都访问不了
【目标检测】30、Rectified IoU: Single-Shot Two-Pronged Detector with Rectified IoU Loss

文章目录一背景二方法三效果论文 Single Shot Two Pronged Detector with Rectified IoU Loss 代码暂无出处 ACM MM 2020 一背景在检测任务重 IoU 经常被
Eclipse引用外部project android library

http my oschina net u 1777508 blog 345022 1 应用外部jar包我们平时用的最多的方式把要引入的jar包放在project的lib目录下然后 Add JARs 2 引用java Project
Rocky9 KVM网桥的配置

KVM的默认网络模式为NAT 借助宿主机模式上网现在我们来改成桥接模式这样外界就可以直接和宿主机里的虚拟机通讯了 Bridge方式即虚拟网桥的网络连接方式是客户机和子网里面的机器能够互相通信可以使虚拟机成为网络中具有独立IP的主机
vue3使用高德地图api，海量点，多边形围栏，热力图，轨迹线（一）

首先在项目中引入高德地图这个就不详细教了官方文档都有教程这里讲如何在页面中使用各种api方法一初始化map对象首先在页面初始化时创建地图map对象保存这个map对象后面的所有api方法都要用到这个map对象以下是初始化ma
java-maven3.6.3安装及配置

注以下以本人安装过程为例 1 maven3 6 3下载地址 https archive apache org dist maven maven 3 3 6 3 binaries 其他版本可在目录中寻找 2 按下图所示操作新建 maven
单电源转正负电源的实现方式

采用TPS5430将单电源转换成双电源的方式供电亲测有效具体实现电路如下图
流程设计

上图为流程设计器的主界面左边栏目为树形结构提供两种树形一个为流程定义的分类的树形另外一个为根据模块菜单的树形功能描述 1 新增新增功能主要处理定义的工作流程的建立 2 删除删除定义的工作流注意删除只能删除处于设计状态的工作
ssm整合中各个配置类的内容及注解详解

文章目录 1 配置类 1 JdbcConfig 2 SpringConfig 3 SpringMvcConfig 4 ServletConfig 5 MyBatisConfig 6 SpringMvcSupport 1 配置类 1 Jdbc
vscode配置C/C++简单环境

官网下载vscode 官网下载mingw编译器安装c c 扩展我安装了1 8 4版本会自动生成task json lauch json文件 VScode打开一个文件夹就相当于一个项目然后新建 cpp f5运行会提示选择环境变量中的
MYSQL常用命令大全

文章目录基本语句 explain关键字链接数据库显示已有数据库创建数据库选择数据库显示数据库中的表显示当前数据库的版本信息链接用户名删除数据库创建表表增加将查询结果插入到新表中表删除表修改表查
springboot application 配置

springboot项目默认启动端口是8080 下面更改端口到8081 server port 8081 配置项 springboot官方提供的配置项 SpringBoot程序可以在application properties文件中进行属性
vue上传文件纯前端实现进度条

效果代码
Python爬虫：收集食谱和烹饪指南的完整教程

目录第一步确定目标食谱和烹饪指南网站第二步安装必要的库
fairseq常用的命令行参数

fairseq train tensorboard logdir 可视化训练过程 keep last epochs 10 默认保存最后10个epoch eval bleu 在验证阶段评估bleu eval bleu args beam 5

fairseq常用的命令行参数

fairseq-train

fairseq-generate

fairseq-score

fairseq-interactive

fairseq常用的命令行参数 的相关文章

随机推荐

热门标签

fairseq常用的命令行参数的相关文章