fairseq常用的命令行参数

2023-10-29

fairseq-train

--tensorboard-logdir   #可视化训练过程
--keep-last-epochs 10  # 默认保存最后10个epoch
--eval-bleu            # 在验证阶段评估bleu
--eval-bleu-args '{"beam": 5, "max_len_a": 1.2, "max_len_b": 10}'      # 评估bleu的参数
--eval-bleu-detok moses   # 验证阶段时使用moses工具来进行detokenize
--eval-bleu-remove-bpe  # 在验证阶段评估bleu时 remove-bpe
--best-checkpoint-metric bleu # 选择best-checkpoint的策略,默认是loss最低,这里使用bleu
--maximize-best-checkpoint-metric  # 最大化选择best-checkpoint的策略,在使用bleu时使用
--patience 10  			# 如果连续10次验证运行的有效性能没有提高,则提前停止训练

fairseq-generate

--beam 5  # 解码时beam search设置为5
--remove-bpe # 生成remove bpe之后的结果
--scoring sacrebleu  # 默认使用bleu
--sacrebleu   # 效果同上
--quiet       # 只打印最终成绩

fairseq-score

-s, --sys   # 机器翻译模型的输出
-r, --ref   # 目标语句
-o, --order  # n-gram的阶数,默认为4
--ignore-case   # 大小写敏感的分数
--sacrebleu     # 使用sacrebleu
--sentence-bleu    # 报告句子级别的BLEU

fairseq-interactive

--path    # 模型checkpoint的路径
data
--beam    # beam size
--source-lang  # 源语言类型
--target-lang  # 目标语言类型
--tokenizer    # 使用的tokenizer,可以选择使用 moses、nltk和space
--bpe          # 使用的bpe,可以选择用 byte_bpe、bytes、characters、fastbpe、gpt2、bert、hf_byte_bpe、sentencepiece、 subword_nmt
--bpe-codes   # 指定训练得到的bpe-codes
--max-len-a   # 生成的最大长度为 ax+b(x是源序列长度),这里指定a,默认为0
--max-len-b   # 生成的最大长度为 ax+b(x是源序列长度),这里指定b,默认为200
--min-len     # 最小生成长度,默认为1

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

fairseq常用的命令行参数 的相关文章

随机推荐

  • TypeError: this.getOptions is not a functionj解决方案

    遇到的问题 在使用react搭建项目 在配置less的时候一直报如下错误 我以为webpack配置错了 尝试了很多办法 最终找到了原因 less loader版本过高 解决方案 1 npm uninstall less loader 2 n
  • vwware docker安装seata

    参考 docker安装seata
  • vue Mac环境下npm run serve提示 node_modules/.bin/vue-cli-service: Permission denied

    Mac环境下 使用 npm run dev 命令运行 Vue 项目时 报错 no such file or directory open package json 但是 明明项目中有package json这个文件 如下图 问题 一般这种情
  • java 泛型 class< >_Java中泛型T和Class以及Class的理解(轉)

    注意 class是java的關鍵字 在聲明Java類時使用 Class類的實例表示Java應用運行時的類 class ans enum 或接口 interface and annotation 每個Java類運行時都在JVM里表現為一個Cl
  • STM32 复位时钟控制—RCC

    时钟分为系统时钟 外设时钟 我们今天来看一下系统时钟 stm32的系统时钟由固件库配置好 不需要修改 我们了解认识一下 并学会修改使用 目录 1 系统时钟介绍 8个部分 2 程序分析 1 用HSE配置系统时钟 2 用HIS配置系统时钟 下图
  • Docker容器连不了网的一种解决方式

    问题分析 首先 容器在之前用到过 联网也没有问题 我这边使用的还是容器内固定ip 所以问题肯定是后面才出现的 容器本身没有做任何改变 解决方式 如果你跟我一样 docker容器是突然访问不了网 包括容器内访问外网 宿主机访问容器 都访问不了
  • 【目标检测】30、Rectified IoU: Single-Shot Two-Pronged Detector with Rectified IoU Loss

    文章目录 一 背景 二 方法 三 效果 论文 Single Shot Two Pronged Detector with Rectified IoU Loss 代码 暂无 出处 ACM MM 2020 一 背景 在检测任务重 IoU 经常被
  • Eclipse引用外部project android library

    http my oschina net u 1777508 blog 345022 1 应用外部jar包 我们平时用的最多的方式 把要引入的jar包 放在project的lib目录下 然后 Add JARs 2 引用java Project
  • Rocky9 KVM网桥的配置

    KVM的默认网络模式为NAT 借助宿主机模式上网 现在我们来改成桥接模式 这样外界就可以直接和宿主机里的虚拟机通讯了 Bridge方式即虚拟网桥的网络连接方式 是客户机和子网里面的机器能够互相通信 可以使虚拟机成为网络中具有独立IP的主机
  • vue3使用高德地图api,海量点,多边形围栏,热力图,轨迹线(一)

    首先在项目中引入高德地图 这个就不详细教了 官方文档都有教程 这里讲如何在页面中使用各种api方法 一 初始化map对象 首先在页面初始化时创建地图map对象 保存这个map对象 后面的所有api方法都要用到这个map对象 以下是初始化ma
  • java-maven3.6.3安装及配置

    注 以下以本人安装过程为例 1 maven3 6 3下载地址 https archive apache org dist maven maven 3 3 6 3 binaries 其他版本可在目录中寻找 2 按下图所示操作 新建 maven
  • 单电源转正负电源的实现方式

    采用TPS5430将单电源转换成双电源的方式供电 亲测有效 具体实现电路如下图
  • 流程设计

    上图为流程设计器的主界面 左边栏目为树形结构 提供两种树形 一个为流程定义的分类的树形 另外一个为根据模块菜单的树形 功能描述 1 新增 新增功能主要处理定义的工作流程的建立 2 删除 删除定义的工作流 注意 删除只能删除处于设计状态的工作
  • ssm整合中各个配置类的内容及注解详解

    文章目录 1 配置类 1 JdbcConfig 2 SpringConfig 3 SpringMvcConfig 4 ServletConfig 5 MyBatisConfig 6 SpringMvcSupport 1 配置类 1 Jdbc
  • vscode配置C/C++简单环境

    官网下载vscode 官网下载mingw编译器 安装c c 扩展 我安装了1 8 4版本 会自动生成task json lauch json文件 VScode打开一个文件夹就相当于一个项目 然后新建 cpp f5运行 会提示选择环境变量中的
  • MYSQL常用命令大全

    文章目录 基本语句 explain关键字 链接数据库 显示已有数据库 创建数据库 选择数据库 显示数据库中的表 显示当前数据库的版本信息 链接用户名 删除数据库 创建表 表 增加 将查询结果插入到新表中 表 删除 表 修改 表 查
  • springboot application 配置

    springboot项目默认启动端口是8080 下面更改端口到8081 server port 8081 配置项 springboot官方提供的配置项 SpringBoot程序可以在application properties文件中进行属性
  • vue上传文件纯前端实现进度条

    效果 代码
  • Python爬虫:收集食谱和烹饪指南的完整教程

    目录 第一步 确定目标食谱和烹饪指南网站 第二步 安装必要的库
  • fairseq常用的命令行参数

    fairseq train tensorboard logdir 可视化训练过程 keep last epochs 10 默认保存最后10个epoch eval bleu 在验证阶段评估bleu eval bleu args beam 5