huggingfacetransformers

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

def split data path df pd read csv path return train test split df test size 0 1 random state 100 train test split data

Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py

python tensorflow NLP Pytorch huggingfacetransformers

下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文

python NLP Pytorch huggingfacetransformers

在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert

NLP Pytorch bertlanguagemodel huggingfacetransformers fastai

Huggingface Bert TPU 微调适用于 Colab，但不适用于 GCP

我正在尝试在 TPU 上微调 Huggingface Transformers BERT 模型它在 Colab 中工作但当我切换到 GCP 上的付费 TPU 时失败 Jupyter笔记本代码如下 1 model transformers

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

当我们查看 HuggingFaceHub 模型的使用情况时langchain有这部分作者不知道如何停止生成 https github com hwchase17 langchain blob master langchain llms hu

训练新的 AutoTokenizer 拥抱脸部

收到此错误 AttributeError GPT2Tokenizer 对象没有属性 train new from iterator 与拥抱面部文档非常相似我更改了输入就是这样不应该影响它有一次就成功了 2小时后回来查看发现并没有

python NLP datascience huggingfacetransformers transformermodel

运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last

python Algorithm NLP Pytorch huggingfacetransformers

预训练 Transformer 模型的配置更改

我正在尝试为重整变压器实现一个分类头分类头工作正常但是当我尝试更改配置参数之一 config axis pos shape 即模型的序列长度参数时它会抛出错误 Reformer embeddings position embeddin

Pytorch huggingfacetransformers pretrainedmodel

BertTokenizer.from_pretrained 错误并显示“连接错误”

我正在尝试从 Huggingface 下载 BERT 的分词器我正在执行 tokenizer BertTokenizer from pretrained bert base uncased Error

python SSL sslcertificate huggingfacetransformers

为什么将模型上传到 HuggingFace 存储库的速度如此之慢？

我有一个问题我正在尝试将模型推送到 HuggingFace 存储库问题是它说上传过去 16 小时而这只是 pytorch model bin 文件大约 850MB 我用的是LFS 我尝试手动将文件添加到存储库这需要很长时间我不愿

huggingfacetransformers transformermodel

BERT 问答中长文本的滑动窗口

我读过解释滑动窗口如何工作的帖子但我找不到有关其实际实现方式的任何信息据我了解如果输入太长可以使用滑动窗口来处理文本如果我错了请纠正我说我有一条短信 2017 年 6 月 Kaggle 宣布注册用户突破 100 万给定一些s

在微调 GPT-2 模型时如何处理堆栈期望每个张量具有相同大小的误差？

我尝试用我的个人信息微调模型所以我可以创建一个聊天框人们可以通过聊天 gpt 了解我但是我得到了错误 RuntimeError 堆栈期望每个张量大小相等但在条目 0 处得到 47 在条目 1 处得到 36 因为我有不同的输入长度

python tensorflow artificialintelligence huggingfacetransformers GPT2

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids

我训练了一个基于 BERT 的编码器解码器模型 EncoderDecoderModel named ed model使用 HuggingFace 的变压器模块我用的是BertTokenizer命名为input tokenizer 我用以下

bertlanguagemodel huggingfacetransformers

PipelineException：在输入中找不到 mask_token ([MASK])

我收到此错误 PipelineException 在输入中找不到 mask token MASK 当我运行这条线时 fill mask 汽车我在 Colab 上运行它我的代码 from transformers import BertT

python NLP Pytorch bertlanguagemodel huggingfacetransformers

为什么评估集会耗尽 pytorch 拥抱中的内存？

我使用的是相当大的 GPU 大约 80 GB 训练纪元运行良好但由于某种原因在评估时训练集和验证集或多或少具有相同的长度我内存不足并收到此错误 File home transformers trainer pt utils py li

Pytorch NLP huggingfacetransformers pretrainedmodel

使用新标签微调模型的分类器层

我想使用仅包含 1 个模型之前未见过的附加标签的新数据集来微调已经微调的 BertForSequenceClassification 模型这样我想向模型当前能够正确分类的标签集添加 1 个新标签此外我不希望随机初始化分类器权重我想

Pytorch huggingfacetransformers

AutoTokenizer.from_pretrained 无法加载本地保存的预训练分词器 (PyTorch)

我是 PyTorch 的新手最近我一直在尝试使用 Transformers 我正在使用 HuggingFace 提供的预训练分词器我成功下载并运行它们但如果我尝试保存它们并再次加载则会发生一些错误如果我使用AutoTokenize

BERT 分词器和模型下载

我是初学者我正在和伯特一起工作但出于公司网络的安全考虑下面的代码并没有直接接收bert模型 tokenizer BertTokenizer from pretrained bert base multilingual cased do

python GitHub Pytorch huggingfacetransformers bertlanguagemodel

基于 BERT 的 NER 模型在反序列化时给出不一致的预测

我正在尝试在 Colab 云 GPU 上使用 HuggingFace 变压器库训练 NER 模型对其进行 pickle 并将模型加载到我自己的 CPU 上以进行预测 Code 模型如下 from transformers import B

python Pytorch bertlanguagemodel huggingfacetransformers