huggingfacetransformers

Fine-Tuning DistilBertForSequenceClassification：不是学习，为什么loss没有变化？权重没有更新？

我对 PyTorch 和 Huggingface transformers 比较陌生并对此尝试了 DistillBertForSequenceClassificationKaggle 数据集 https www kaggle com c

NLP Pytorch textclassification lossfunction huggingfacetransformers

保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下

python NLP Pytorch huggingfacetransformers bertlanguagemodel

应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr

python tensorflow Keras huggingfacetransformers sentencetransformers

如何使用 Huggingface 变压器加载基于 llama 的微调 pef/lora 模型？

我已经关注了this https www youtube com watch v Us5ZFp16PaU教程 Colab笔记本 https colab research google com drive 14xo6sj4dARk8lXZbO

python huggingfacetransformers llamaindex PEFT

使用 Huggingface 转换器进行命名实体识别，映射回完整实体

我正在查看文档用于命名实体识别的 Huggingface 管道 https huggingface co transformers task summary html named entity recognition 我不清楚这些结果如何用

huggingfacetransformers

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

def split data path df pd read csv path return train test split df test size 0 1 random state 100 train test split data

Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py

python tensorflow NLP Pytorch huggingfacetransformers

下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文

python NLP Pytorch huggingfacetransformers

在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert

NLP Pytorch bertlanguagemodel huggingfacetransformers fastai

Huggingface Bert TPU 微调适用于 Colab，但不适用于 GCP

我正在尝试在 TPU 上微调 Huggingface Transformers BERT 模型它在 Colab 中工作但当我切换到 GCP 上的付费 TPU 时失败 Jupyter笔记本代码如下 1 model transformers

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

当我们查看 HuggingFaceHub 模型的使用情况时langchain有这部分作者不知道如何停止生成 https github com hwchase17 langchain blob master langchain llms hu

训练新的 AutoTokenizer 拥抱脸部

收到此错误 AttributeError GPT2Tokenizer 对象没有属性 train new from iterator 与拥抱面部文档非常相似我更改了输入就是这样不应该影响它有一次就成功了 2小时后回来查看发现并没有

python NLP datascience huggingfacetransformers transformermodel

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last

python Algorithm NLP Pytorch huggingfacetransformers

预训练 Transformer 模型的配置更改

我正在尝试为重整变压器实现一个分类头分类头工作正常但是当我尝试更改配置参数之一 config axis pos shape 即模型的序列长度参数时它会抛出错误 Reformer embeddings position embeddin

Pytorch huggingfacetransformers pretrainedmodel

BertTokenizer.from_pretrained 错误并显示“连接错误”

我正在尝试从 Huggingface 下载 BERT 的分词器我正在执行 tokenizer BertTokenizer from pretrained bert base uncased Error

python SSL sslcertificate huggingfacetransformers

为什么将模型上传到 HuggingFace 存储库的速度如此之慢？

我有一个问题我正在尝试将模型推送到 HuggingFace 存储库问题是它说上传过去 16 小时而这只是 pytorch model bin 文件大约 850MB 我用的是LFS 我尝试手动将文件添加到存储库这需要很长时间我不愿

huggingfacetransformers transformermodel

BERT 问答中长文本的滑动窗口

我读过解释滑动窗口如何工作的帖子但我找不到有关其实际实现方式的任何信息据我了解如果输入太长可以使用滑动窗口来处理文本如果我错了请纠正我说我有一条短信 2017 年 6 月 Kaggle 宣布注册用户突破 100 万给定一些s

在微调 GPT-2 模型时如何处理堆栈期望每个张量具有相同大小的误差？

我尝试用我的个人信息微调模型所以我可以创建一个聊天框人们可以通过聊天 gpt 了解我但是我得到了错误 RuntimeError 堆栈期望每个张量大小相等但在条目 0 处得到 47 在条目 1 处得到 36 因为我有不同的输入长度

python tensorflow artificialintelligence huggingfacetransformers GPT2

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids

我训练了一个基于 BERT 的编码器解码器模型 EncoderDecoderModel named ed model使用 HuggingFace 的变压器模块我用的是BertTokenizer命名为input tokenizer 我用以下

bertlanguagemodel huggingfacetransformers

PipelineException：在输入中找不到 mask_token ([MASK])

我收到此错误 PipelineException 在输入中找不到 mask token MASK 当我运行这条线时 fill mask 汽车我在 Colab 上运行它我的代码 from transformers import BertT

python NLP Pytorch bertlanguagemodel huggingfacetransformers