下载变压器模型以供离线使用

2024-04-20

我有一个训练有素的 Transformer NER 模型，我想在未连接到互联网的机器上使用它。加载此类模型时，当前会将缓存文件下载到 .cache 文件夹。

要离线加载并运行模型，需要将 .cache 文件夹中的文件复制到离线机器上。然而，这些文件具有很长的、非描述性的名称，如果您想要使用多个模型，那么很难识别正确的文件。对此有什么想法吗？

模型文件示例 https://i.stack.imgur.com/0CFZj.png

处理这个问题的一种相对简单的方法是简单地“重命名”预训练模型，详细信息参见this https://github.com/huggingface/transformers/issues/2157 thread.

本质上，对于您尝试使用的任何模型，您所要做的就是这样：

from transformers import BertModel

model = BertModel.from_pretrained("bert-base-uncased")
model.save_pretrained("./my_named_bert")

该线程还详细介绍了本地模型文件夹的命名方式，请参阅 LysandreJik 的帖子：

您好，它们之所以如此命名，是因为这是确保 S3 上的模型与缓存中的模型相同的干净方法。该名称是根据 S3 上托管的文件的 etag 创建的。 [...]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NLP

Pytorch

huggingfacetransformers

下载变压器模型以供离线使用的相关文章

我正在用 python 编写一个电报机器人

我想通过Python编写一个电报机器人但它不起作用 import telebot bot telebot TeleBot my token bot message handler content types text def sendin
使用 Python 连接从 FTP 检索文件

我构建了这个简单的工具来暴力破解并连接到 ftp 服务器 import socket import ftplib from ftplib import FTP port 21 ip 192 168 1 108 file1 passwords
将 KB/MB/GB 等字符串解析为数值

为了不发明自行车我想知道是否有任何库能够将大小字符串 MB KB TB MiB KiB 等的各种表示形式解析为基于数字字节的值 ActiveState Receipes 有一个示例here http code activestate c
AWS Lambda - 在区域之间自动复制 EC2 快照？

我想创建一个 Lambda 函数 python 它将自动将已创建的快照复制到另一个区域我已联系 AWS Support 他们只向我发送了用于 RDS 数据库的 GitHub 脚本没有 EC2 快照复制脚本任何帮助都会很棒谢谢是的
Matplotlib 动画未显示

当我在家里的电脑上尝试这个时它可以工作但在工作的电脑上却不行这是代码 import numpy as np import matplotlib pyplot as plt import matplotlib animation as
Unpickle 二进制文件为文本[重复]

这个问题在这里已经有答案了我需要对基本上如下所示的系统进行一些维护复杂的遗留Python程序 gt 二进制pickle文件 gt 另一个复杂的遗留Python程序这需要准确弄清楚中间 pickle 文件中的内容我怀疑文件格式比生成和
混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”

我得到了 Classification metrics can t handle a mix of multilabel indicator and multiclass targets 当我尝试使用混淆矩阵时出错我正在做我的第一个深度学
scipy 的 curve_fit 函数的尺寸问题

我对 python 中的曲线拟合以及一般的 python 都很陌生目前我正在尝试使用 scipy 中的 curve fit 模块来拟合 4 个光谱峰简而言之我的文本文件中有两列数据所以我的第一步是将数据导入到两个数组中一个包含
如何使用增量值向 Pyspark 中的 DataFrame 添加列？

我有一个名为 df 的 DataFrame 如下所示 Atr1 Atr2 Atr3 A A A B A A C A A 我想向其中添加一个具有增量值的新列并获取以下更新的 DataFrame Atr1 Atr2 Atr3
如何在 Python 中重命名文件并保留创建日期

我知道创建日期不存储在文件系统本身中但是当我使用时我遇到了问题os rename 它正在更新我正在使用的文件的创建日期是否可以重命名文件而不更改其原始创建日期正如都铎所说你可以使用os stat http docs python o
没有名为 objc 的模块

我正在尝试将 cocoa python 与 Xcode 一起使用但它总是会出现错误 Traceback most recent call last File main py line 10 in
有没有办法在Python中调用子类定义的方法？

The init 方法定义了创建类的实例时要执行的操作创建子类时我可以做类似的事情吗假设我有抽象类Entity class Entity def onsubclasscreation cls for var in cls annotat
使用 pymongo 查询空字段

我想使用 python 查询 mongo 中的空字段但是它很难处理单词 null 或 false 它要么给我错误它们在 python 中未定义要么在 mongo 中搜索字符串 null 和 false 这两种情况我都不希望发生 col
Python 字符串参数解析

我正在 python 中使用 cmd 类它将所有参数作为一个大字符串传递给我将此 arg 字符串标记为 args 数组的最佳方法是什么 Example args arg arg1 arg2 with quotes arg4 arg5 1
结束一天（日期时间）的最优雅的方式是什么？

我目前正在编写一些报告代码允许用户选择指定日期范围它的工作方式简化是用户可选指定年份用户可选指定月份用户可选指定一天这是一个代码片段以及描述我想要的内容的注释like to do from datetime i
传递宏作为参数 jinja dbt

Today date milliseconds 是我在项目中的宏如何将此宏重定向为参数以便默认情况下我可以在 yml 中编写另一个宏 test valid date model column name exclude condition
嵌套 for 循环以列出具有不同“if”条件的理解

我正在尝试将此嵌套循环转换为列表理解但我不确定是否可能因为 tmp 列表中的项目可能有不同的值这是最好的方法吗谢谢 final for a in range 13 1 for b in range 0 4 for c in rang
尝试输入字符串时出现名称错误[重复]

这个问题在这里已经有答案了 import pickle import os import time class Person def init self number address self number number self addr
launchd执行python脚本，但导入失败

我使用 appscript 编写了一个 python 脚本来跟踪我当前活动的窗口我通过 launchd 运行它但是当我这样做时它无法导入 appscript 我已经在 launchd 的 plist 中设置了 PYTHONPATH 但
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using

随机推荐

在 Zookeeper 中创建路径的最有效方法，其中路径的根元素可能存在也可能不存在？

想象一条路径 root child1 child2 child3 想象一下在动物园管理员中可能存在其中的一部分比如 root child1 Zookeeper 中没有等效的 mkdir p 此外如果任何一个操作失败 ZooKeepe
子类化 multiprocessing.managers.BaseProxy

我在尝试实施新的方法时遇到了一些麻烦defaultdict代理对象这文档 https docs python org 3 library multiprocessing html multiprocessing managers Base
有没有办法直接在本机反应中逐字传输chatgpt api的响应（使用javascript）

我想直接在 React Native expo 中使用 Chat GPT Turbo api 与逐字流这里是没有流的工作示例 fetch https api openai com v1 chat completions body JSON
如何使用PowerShell连接MongoDB？

我已经尝试过以下代码 mongoDbDriverPath C Mongodb net45 mongoServer localhost 27017 Add Type Path mongoDbDriverPath MongoDB Bson dl
Qt 信号和槽、线程、app.exec() 以及相关查询

相关这个问题 https stackoverflow com questions 1450500 我写这段代码是为了理解 qt 信号和槽是如何工作的我需要有人来解释这种行为并告诉我我自己的结论是否正确我的程序 connectionha
如何创建类似 iPhoto 的界面

我正在尝试创建一个类似 iPhoto 的应用程序其中使用一组对象我希望显示一个拇指以及每个拇指底部的标题如何像 iPhoto 那样显示对象看一下NSCollectionView NSCollectionViewItem http d
MiniBatchKMeans OverflowError：无法将浮点无穷大转换为整数？

我正在尝试找到正确数量的簇 k 根据轮廓分数使用sklearn cluster MiniBatchKMeans from sklearn cluster import MiniBatchKMeans from sklearn feature
如何修复 Visual C++ 2010 中静态库项目中的警告 MSB8012？

我正在尝试将静态库从 VC 2008 转换为 VC 2010 我得到这些关于 TargetPath 和 TargetName 的警告我查看了我的配置我不知道如何让这些消失对于我通常构建一次并且很少重建的静态库来说这是严重的还是真的
Windows身份验证并通过数据库添加授权角色 - MVC asp.net

我是 mvc4 asp net 的新手对身份验证和授权感到困惑我们的网站是一个内部网站它从 Windows 身份验证中获取用户名 HttpContext Current User Identity Name 并检查数据库是否存在用户名
将 WordPress 页面的标题设置为只读

我正在寻找一个 WP 函数将只读参数添加到所有页面标题的输入中这将使页面的标题不可更改预先非常感谢这可以通过一些简单的 JavaScript jQuery 来完成创建一个名为 admin title disable js 的文件
Android 中 ID 的命名约定

安卓2 3 3 我有一个关于 Android 中 ID 命名的问题假设我在 Activity1 中有两个按钮保存和取消我将它们 ID 命名为 btnSave 和 btnCancel 现在我有 Activity2 其中也有保存和取消按钮
React-Datepicker MomentJS 无效日期

我正在使用 React Datepicker 和 MomentJS 但是当我想使用 Moment 设置开始日期时该值在日期选择器字段中给出无效日期当我在控制台中记录 this state startDate 时控制台显示以下内容开始
jinja 模板变量赋值范围

鉴于以下 Jinja 片段 set sep for stamp in stamp list for heartbeat in heartbeat list if heartbeat name site name and heartbeat
Jbuilder Rails 缓存速度较慢

我尝试将缓存与集合一起使用使用多种解决方案问题是每当我尝试缓存时响应都会变慢考虑以下集合示例该集合为其中的每个项目大约 25 个项目呈现 2 个部分 json data do json array organizations
被 chrome 扩展内的 jquery 调用难住了

在我的 chrome 扩展中我称之为 jsonPost email email protected cdn cgi l email protection password demo content selected text val no
哪种语言（在 JVM 上运行）最适合创建 DSL？

我们需要创建复杂的固定长度和可变长度字符串这些字符串可能代表客户资料订单等你们建议使用哪种基于 JVM 的编程语言想法是让最终用户使用此 DSL 创建字符串所以我正在寻找验证代码完成等 Groovy http docs code
是服务中的 AtomicLong 字段，是实现服务器端标识符以通过存储库持久保存实体的好方法

我正在开发一个 SpringBoot 应用程序我的严格要求是生成服务器端 a 数字 ID对于一个实体然后通过存储库将其持久化由于每个 Service 都是无状态的因此都是单例因此使用 AtomicLong 是实现它的好方法吗这是
如何在 dxdatagrid 中动态创建具有 dataType 的 dxi 列？

我们正在开发一个角度应用程序我必须在 dxdatagrid 中显示记录每次模式都会不同数据来自不同的表想要添加编辑记录想要显示与每种数据类型对应的控件请任何人帮助实现同样的目标您可以使用该属性 columns 在你的dx d
如何（以及为什么）使用显示：表格单元格 (CSS)

我有一个网站very活动背景我说的是 6 个左右不同的 z 索引这里 2 个带有动画我想要一个有内容的前景但想要一个通向背景的窗口我遇到的一些问题你不能在背景上打洞所以我构建了一个包含 div 我们称之为 srminfo
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文

下载变压器模型以供离线使用

下载变压器模型以供离线使用 的相关文章

随机推荐

热门标签

下载变压器模型以供离线使用的相关文章