Blenderbot 微调

2024-04-26

我一直在尝试微调 HuggingFace 的对话模型：Blendebot。我已经尝试过官方拥抱脸网站上给出的传统方法，该方法要求我们使用 trainer.train() 方法来完成此操作。我使用 .compile() 方法尝试了它。我尝试过使用 PyTorch 以及 TensorFlow 对我的数据集进行微调。这两种方法似乎都失败了，并给我们一个错误，指出没有适用于 Blenderbot 模型的编译或训练方法。我什至在网上到处查了一下 Blenderbot 如何对我的自定义数据进行微调，但没有任何地方正确提到运行时不会抛出错误。我浏览了 Youtube 教程、博客和 StackOverflow 帖子，但没有一个回答这个问题。希望有人能在这里回复并帮助我。我也愿意使用其他 HuggingFace 对话模型进行微调。

这是我用来微调 Blenderbot 模型的链接。

微调方法：https://huggingface.co/docs/transformers/training https://huggingface.co/docs/transformers/training

搅拌机机器人：https://huggingface.co/docs/transformers/model_doc/blenderbot https://huggingface.co/docs/transformers/model_doc/blenderbot

from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration
mname = "facebook/blenderbot-400M-distill"
model = BlenderbotForConditionalGeneration.from_pretrained(mname)
tokenizer = BlenderbotTokenizer.from_pretrained(mname)


#FOR TRAINING: 

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train_dataset,
    eval_dataset=small_eval_dataset,
    compute_metrics=compute_metrics,
)
trainer.train()

#OR

model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics=tf.metrics.SparseCategoricalAccuracy(),
)

model.fit(tf_train_dataset, validation_data=tf_validation_dataset, epochs=3)

这些都不起作用。

也许尝试使用TFBlenderbotForConditionalGeneration类为Tensorflow。它有你需要的东西：

import tensorflow as tf
from transformers import BlenderbotTokenizer, TFBlenderbotForConditionalGeneration

mname = "facebook/blenderbot-400M-distill"
model = TFBlenderbotForConditionalGeneration.from_pretrained(mname)
tokenizer = BlenderbotTokenizer.from_pretrained(mname)

model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    metrics=tf.metrics.SparseCategoricalAccuracy(),
)
....

See the docs https://huggingface.co/docs/transformers/model_doc/blenderbot#transformers.TFBlenderbotForConditionalGeneration了解更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Blenderbot 微调的相关文章

如何下载 NLTK 数据？

更新的答案 NLTK 适用于 2 7 我有3 2 我卸载了3 2并安装了2 7 现在可以了我已经安装了 NLTK 并尝试下载 NLTK 数据我所做的是按照该网站上的说明进行操作 http www nltk org data html h
在 Python 3.5 64 位上通过 pip 安装 OpenCV

我尝试安装 OpenCV 但找不到任何合适的 pip 软件包我决定上网查找有关如何安装它的官方文档并发现this https opencv python tutroals readthedocs io en latest py tuto
这是在 python 中美白图像的正确方法吗？

我在尝试着zero center and whiten CIFAR10数据集但我得到的结果看起来像随机噪声 Cifar10数据集包含60 000尺寸的彩色图像32x32 训练集包含50 000和测试集包含10 000分别是图像以下代码片
使用光栅重新投影 .tiff 文件：CRSError：无法解析 WKT。 OGR 错误代码 6

我正在尝试使用以下代码将 tiff 文件重新投影到 EPSG 32638 我安装过的版本光栅版本 1 1 5 Numpy 版本 1 18 1 这是我正在使用的代码 https rasterio readthedocs io en late
使用 openCV 和 python 检测物体

我正在尝试使用 OpenCV 和 Python 检测下图中的白点我尝试使用函数 cv2 HoughCircles 但没有成功我需要使用不同的方法吗这是我的代码 import cv2 cv import numpy as np impo
用python计算网页大小

我将如何使用 Python 计算网页 url 的大小我尝试了 urllib2 并获取内容长度标头但它不存在 import urllib2 url http www google com r urllib2 urlopen url Not
Apache2 mod_wsgi 403 禁止错误

我已经正确配置了它但后来我决定重新安装我的 Debian 顺便从 wheezy 切换到 jessie 版本问题是这样的我有一个 python mod wsgi 应用程序 mnt doc Python www index py ls l
计算两个表中等效行的交集

我有两个 FITS 文件让我们考虑一下例如第一个文件有 100 行和 2 列第二个文件有 1000 行和 2 列 FITS FILE 1 FITS FILE 2 A B C D 1 2 1 2 1 3 1 2 2 4 1 2 我需要采取
Pandas 多索引数据框删除行

我的多索引 DF 如下 tuples list zip a a b b c d c d index pd MultiIndex from tuples tuples names i1 i2 df pd DataFrame 5 6 7 8 i
如何在 Ubuntu 上通过 pip 安装 python3 版本的软件包？

我两者都有python2 7 and python3 2安装在Ubuntu 12 04 符号链接python链接到python2 7 当我输入 sudo pip install package name 它将默认安装python2的版本pa
如何将填充轮廓投影到 3D 曲面图上

我只是想在 3D 中绘制一个表面及其轮廓就像this http matplotlib org examples mplot3d contourf3d demo2 html例子这是我用来执行此操作的代码 import matplotlib
如何在 Microsoft Azure 中提取 Blob 存储中的 Blob 的上次修改日期

我对 MS Azure 的世界还很陌生我正在尝试使用 Python 获取保存在我的 blob 存储中的一堆文件块 blob 的文件名和最后修改日期这是我正在使用的代码 import datetime from azure storag
在 Python 中删除表达式树及其每个子表达式树中第一个元素周围的括号

目标是实现简化操作删除表达式树及其每个子表达式树中第一个元素周围的括号其中表达式作为括在各个括号中的字符串输入给出这必须适用于任意数量的括号例如 12 3 45 6 gt 123 45 6 删除 12 周围的括号然后删除 45 周
Pytest - 如何将参数传递给 setup_class？

我有一些代码如下所示我得到了too few args当我运行它时出错我没有打电话setup class明确地所以不确定如何向它传递任何参数我尝试用以下方法装饰该方法 classmethod 但仍然看到相同的错误我看到的错误是这样
tweepy 计数限制为 200？

我目前正在尝试检索一些拥有大量关注者的大帐户的关注者我正在使用 Tweepy 和这段代码带光标 follower cursors tweepy Cursor api followers id id var count 5000 for
日志处理程序是否使用单独的线程？

蟒蛇的日志处理程序 http docs python org library logging handlers html都很棒其中一些例如SMTP处理程序 http docs python org library logging han
Pandas：Drop() int64 基于值返回对象

我需要删除其中一列低于某个值的所有行我使用了下面的命令但这将列作为对象返回我需要将其保留为int64 df customer id df drop df customer id df customer id lt 9999999 in
带日志图的 Type 1 字体

我正在尝试使用 Matplotlib 图表作为相机就绪的一部分提交出版社要求使用Type 1字体仅有的我发现 PDF 后端很乐意输出 Type 1 字体具有线性 Y 轴的简单图形但输出 Type 3 字体对数 Y 轴使用对数
numpy 沿第一个轴添加

我想通过简单地沿第一个轴执行相同的加法来添加两个具有不同维度的数组非矢量化解决方案 x np array 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 shape 4 3 2 y np a
Python：从 apache authnz_ldap 获取用户

我正在通过 Apache2 的 authnz ldap 模块成功验证 ldap 用户我不清楚如何在他们登录后获取他们的用户名以便我可以通过任何以下表单网页与他们交互我尝试过典型的方法 os getenv os environ get

随机推荐

如何更改 MathJax 中数学的填充？

就像当我的 div 中有我的数学部分时它看起来像这样我将 div 的填充设置为0 那么有没有办法改变数学填充的值呢发现于here https stackoverflow com questions 11296415 how to
Python递归数据读取

如果你曾经玩过我的世界下面的内容将会更有意义由于你们中的许多人还没有我将尽力解释它我正在尝试编写一个递归函数它可以找到从 Minecraft 食谱的平面文件中制作任何 Minecraft 物品的步骤这个实在是让我难住了平面文
[expr.ref]/1 中提到的脚注到底是什么意思？

expr ref 1 http eel is c draft expr ref 1 A postfix expression followed by a dot or an arrow gt optionally followed by t
执行正文 onload 事件后，在 WinForms WebBrowser 中获取 HTML 正文内容

我在 WinForms 中有一个 WebBrowser 控件其 URL 属性设置为外部网页我还有一个用于 DocumentCompleted 事件的事件处理程序在这个处理程序中我试图获取特定元素但 wb Document Body
主机 LAN 上的 LXC 容器

我的 LXC 容器通常与专用网络上的伪装桥配合使用这次我想将容器放在主机的LAN上但我无法得到任何结果我在 debian 上使用 LXC 2 0 7 2 deb9u2 我参考了这个文档 LXC SimpleBridge https w
用于停止表单提交的 JavaScript 代码

停止表单提交的一种方法是从 JavaScript 函数返回 false 单击提交按钮时将调用验证函数我有一个表单验证的案例如果满足该条件我将调用一个名为的函数回到上一页 function returnToPreviousPage w
Google Developers Console：如何注册新应用程序？

我正在努力追随本教程 https developers google com analytics solutions articles hello analytics api register project适用于 Google 的 Ana
npx create-next-app 命令不起作用 ENOENT 错误

它显示了这个错误我正在使用 npx 仍然显示使用纱线当我将它用于反应应用程序时 npx 工作正常它应该为我提供下一个应用程序启动器临时修复可能是 npx create next app latest use npm 以便 creat
如何使用 javascript 在 Whatsapp 上共享图像和文本

你好到目前为止我可以使用 javascript 代码在 Whatsapp 上分享我的内容但仍然无法分享带有文本的图像有人做过吗这是我的 JavaScript 代码 document ready function document
std::tr1::shared_ptr 是如何实现的？

我一直在考虑使用共享指针并且我知道如何自己实现一个不想这样做所以我正在尝试std tr1 shared ptr 我有几个问题引用计数是如何实现的它使用双向链表吗顺便说一句我已经用谷歌搜索过但找不到任何可靠的东西使用过程中有
将命令行参数传递给已运行的应用程序实例

我想将应用程序新实例的命令行参数传递给已经运行的应用程序如果存在到目前为止我已经尝试了以下方法程序 cs string Arguments Environment GetCommandLineArgs int iCurrentPro
以编程方式将音乐文件访问到我的应用程序中

如何以编程方式将设备中的音乐文件访问到我的应用程序中另一种方法可能是使用 MediaStore 内容提供程序来查找您的音乐 http developer android com reference android provider Med
如何查看大 JSON 对象是否包含值？

我正在使用 PHP 对大量多维事件数组进行 json 编码所以我得到如下内容 var ents 7 event id 7 nn The Whisky Drifters nn url the whisky drifters venue Th
如何在 flutter 中重用有状态的 widget

我有一个以下状态完整小部件我需要通过更改两个变量来重用它id and collectionName 一般来说我会提取一个小部件但在这种情况下我正在修改变量firstName 这不会让我提取小部件 class IndividualSi
向量的循环移位（相当于numpy.roll）

我有一个向量 a lt c 1 2 3 4 5 我想做一些类似的事情 b lt roll a 2 4 5 1 2 3 R中有类似的函数吗我一直在谷歌上搜索但 R Roll 主要给我提供有关西班牙语发音的页面怎么样使用head and
WebStorm 没有本地存储的库

我一直在开发一个完全可以在 jsfiddle net 上运行的项目然而当我尝试在 webStorm 中运行这个项目时我收到两个错误 first second 之前我在这里发布我的问题我在 stackoverflow 上搜索但找不到
C++ 模板特化/重载

首先我对这个问题的模糊标题感到抱歉我不知道如何总结它我想要实现的目标如下我希望能够将不同类型的模板非类型参数传递给同一个类模板从而产生不同的实例化像这样的事情 Foo lt 1 gt Foo lt 1 gt different
是否可以在不使用清单的情况下设置 Powershell 模块名称/版本？

我可以看到如果没有清单默认模块名称将设置为 psm1 文件名但是有没有办法在模块代码中设置它我也想在代码中设置版本如果您要导入二进制模块则将从程序集元数据中提取模块版本然而该名称只是 DLL 的文件名对于脚本模块 psm1
尝试在整数后添加字符然后打印结果时出现奇怪的结果

我正在尝试创建一个简单的欧姆定律计算器所以我们的想法是你可以填写两个变量然后它会计算第三个变量当我创建这个程序时我发现了一个小问题我不明白它是如何发生的不幸的是我无法找到答案我尝试打印一个显示完整计算的字符串用户填写的两个变
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py

Blenderbot 微调

Blenderbot 微调 的相关文章

随机推荐

热门标签

Blenderbot 微调的相关文章