使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

2023-11-17

一、下载示例

from huggingface_hub import snapshot_download

repo_id = "THUDM/chatglm2-6b"
local_dir = './chatglm2-6b/'
cache_dir = local_dir + "/cache"
while True:
    try:
        snapshot_download(cache_dir=cache_dir,
        local_dir=local_dir,
        repo_id=repo_id,
        local_dir_use_symlinks=False, # 不转为缓存乱码的形式, auto, Small files (<5MB) are duplicated in `local_dir` while a symlink is created for bigger files.
        resume_download=True,
        allow_patterns=["*.model", "*.json", "*.bin",
        "*.py", "*.md", "*.txt"],
        ignore_patterns=["*.safetensors", "*.msgpack",
        "*.h5", "*.ot", ],
        )
    except Exception as e :
        print(e)

二、资源汇总

Chinese Llama 2 7B 链接：LinkSoul/Chinese-Llama-2-7b · Hugging Face
OpenBuddy-LLaMA2-13B 链接：OpenBuddy/openbuddy-llama2-13b-v8.1-fp16 · Hugging Face
firefly-llama2-13b 链接：GitHub - yangjianxin1/Firefly: Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA)，支持微调Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型
YaYi-7B-Llama2、YaYi-13B-Llama2
链接：wenge-research/yayi-13b-llama2 · Hugging Face
伶荔Chinese-LLaMA-2-7B和13B 链接：GitHub - CVI-SZU/Linly: Chinese-LLaMA 1&2、Chinese-Falcon 基础模型；ChatFlow中文对话模型；中文OpenLLaMA模型；NLP预训练/指令微调数据集
Llama2-Chinese 链接：GitHub - ymcui/Chinese-LLaMA-Alpaca-2: 中文 LLaMA-2 & Alpaca-2 大模型二期项目 (Chinese LLaMA-2 & Alpaca-2 LLMs) 链接：ziqingyang/chinese-llama-2-7b · Hugging Face
Chinese-LLaMA2-7b from LinkSoul 链接：GitHub - LinkSoul-AI/Chinese-Llama-2-7b: 开源社区第一个能下载、能运行的中文 LLaMA2 模型！
Llama2-Chinese-7B from FlagAlpha 链接：GitHub - FlagAlpha/Llama2-Chinese: Llama中文社区，最好的中文Llama大模型，完全开源可商用
YaYi from Wenge 链接：GitHub - wenge-research/YaYi: 雅意大模型：为客户打造安全可靠的专属大模型，基于大规模中英文多领域指令数据训练的 LlaMA 2 & BLOOM 系列模型，由中科闻歌算法团队研发。(Repo for YaYi Chinese LLMs based on LlaMA2 & BLOOM)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP

机器学习

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：的相关文章

如何使用CNN来训练不同大小的输入数据？

CNN 似乎主要针对固定大小的输入来实现现在我想用CNN来训练一些不同大小的句子有哪些常用的方法以下建议主要与用于计算机视觉任务特别是识别的 CNN 相关但也可能对您的领域有所帮助我会看看He 等人的用于视觉识别的深度卷积网
如何获取与某个单词相关的相似单词？

我正在尝试解决一个 nlp 问题其中我有一个单词字典例如 list 1 phone android chair netflit charger macbook laptop sony 现在如果输入是 phone 我可以轻松地使用 in
使用 nltk 中的meteor_score模块评估模型时如何实现meteor分数？

我目前有 2 个文件 reference txt 和 model txt 这两个文本文件包含原始字幕和训练后生成的字幕我可以简单地执行以下操作来获取流星分数 score nltk translate meteor score meteor
在哪里可以找到英语短语列表？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我的任务是搜索文本中陈词滥调和常见短语的用法这些短语与您在财富之轮的短语谜题中可能看到的短语类似这
doc2vec 获得良好性能所需的最小数据集大小是多少？

在不同大小的数据集上进行训练时 doc2vec 的表现如何原始语料库中没有提到数据集大小所以我想知道从 doc2vec 中获得良好性能所需的最小大小是多少有很多东西被称为 doc2vec 但它似乎最常指的是 Le 和 Mikolov
如何在 python-gensim 中使用潜在狄利克雷分配（LDA）来抽象二元组主题而不是一元组？

LDA 原始输出一元语法主题1 水肺水蒸汽潜水主题2 二氧化物植物绿色碳所需输出二元组主题主题1 水肺潜水水蒸气主题2 绿色植物二氧化碳任何想法鉴于我有一个名为docs 包含文档中的单词列表我可以使用 n
使用 Hadoop MapReduce 的计算语言学项目构想

我需要做一个关于计算语言学课程的项目是否有任何有趣的语言问题其数据密集程度足以使用 Hadoop MapReduce 来解决解决方案或算法应尝试分析并提供语言领域的一些见解但是它应该适用于大型数据集以便我可以使用 hado
使用我自己的训练示例训练 spaCy 现有的 POS 标记器

我正在尝试在我自己的词典上训练现有的词性标注器而不是从头开始我不想创建一个空模型在spaCy的文档中它说加载您想要统计的模型下一步是使用add label方法将标签映射添加到标记器但是当我尝试加载英文小模型并添加标签图时
如何提取数字（以及比较形容词或范围）

我正在用 Python 开发两个 NLP 项目它们都有类似的任务提取数值和比较运算符来自句子如下所示 greater than 10 weight not more than 200lbs height in 5 7 feets fas
将 python NLTK 解析树保存到图像文件[重复]

这个问题在这里已经有答案了这可能会复制这个 stackoverflowquestion https stackoverflow com questions 23429117 saving nltk drawn parse tree to
语音识别中如何处理同音词？

对于那些不熟悉什么是同音字 https en wikipedia org wiki Homophone是的我提供以下示例我们的是嗨和高到太二在使用时语音API https developer apple com docume
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
gensim如何计算doc2vec段落向量

我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出段落向量和词向量被平
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
SpaCy 中的自定义句子边界检测

我正在尝试在 spaCy 中编写一个自定义句子分段器它将整个文档作为单个句子返回我编写了一个自定义管道组件它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
缩短文本并仅保留重要句子

德国网站 nandoo net 提供了缩短新闻文章的可能性如果使用滑块更改百分比值文本会发生变化并且某些句子会被遗漏您可以在这里看到它的实际效果 http www nandoo net read article 299925 http
NLTK：包错误？朋克和泡菜？

基本上我不知道为什么会收到此错误只是为了获得更多图像这里有一个代码格式的类似消息由于是最新的该帖子的答案已经在消息中提到 Preprocessing raw texts LookupError Traceback most rec
如何将标记化中的多单词名称保留在一起？

我想使用 TF IDF 特征对文档进行分类一种方法是 from sklearn feature extraction text import TfidfVectorizer import string import re import n
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中

随机推荐

ROS 笔记（01）— Ubuntu 20.04 ROS 环境搭建

ROS 官网 https www ros org ROS 中文官网 http wiki ros org cn 1 系统和 ROS 版本不同的 ROS 版本所需的 ubuntu 版本不同每一版 ROS 都有其对应版本的 Ubuntu 切记
基于自然语言处理技术的智能化自然语言生成技术应用于智能写作工具开发

文章目录基于自然语言处理技术的智能化自然语言生成技术应用于智能写作工具开发 1 引言 2 技术原理及概念 2 1 基本概念解释 2 2 技术原理介绍算法原理操作步骤数学公式等 2 2 1 语音识别 2 2 2 自然语言理解 2 2
Vue中引用assets中的图片的几种方式

作为img标签引进来 img class img alt example 作为背景图片引入 span span
vue-router "path" is required in a route configuration

启用了动态路由一直提示这个错误页面打开也是空白后来发现原来是component参数错误正确的写法为 component gt import views own space own space vue 我错误的写为了 componen
毕业设计 stm32 RFID智能仓库管理系统(源码+硬件+论文)

文章目录 0 前言 1 主要功能 3 核心软件设计 4 实现效果 5 最后 0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的毕设题目缺少创新和亮点往往达不到毕业答辩的要求这两年不断有学弟学妹告诉学长自己做的项目系统达不
数据结构算法题——杂

leetcode 7 整数反转 leetcode 7 整数反转给你一个 32 位的有符号整数 x 返回将 x 中的数字部分反转后的结果如果反转后整数超过 32 位的有符号整数的范围 231 231 1 就返回 0 假设环境不允许存储 6
浅谈年轻人低存款状态与面临的困难

目前我的存款处于一万元以上的区间对于我个人而言存款并不是一件太过困难的事情我秉持着理财的原则通过合理的规划和节制开支我能够将一部分收入用于存款同时我也会尽量避免不必要的消费以确保有足够的资金用于应急和未来的规划我相信理
maven打包内存溢出,或者打包时间太长导致未知错误

在idea中使用maven打包内存溢出问题 qq 27607447的博客 CSDN博客
numpy常用函数（一元通用函数、二元通用函数列表）

Numpy通用函数也可以称为ufunc 是一种在ndarray数据中进行逐个元素操作的函数某些简单函数接受一个或多个标量数值并产生一个或多个标量结果而通用函数就是对这样简单函数的向量化封装 1 一元通用函数比如sqrt或exp举例
淘宝图片轮播代码

下面图片轮播代码中 ul class lst main 与 ul 之间的代码为用户可以自定义修改的部分为轮播的图片地址和超级连接地址信息 li a href http mb2 yubaibai com cn 201011 30 90221
String类常用方法系列八：替换

1 String replace target value 替换指定字符 Test public void test1 String str 好好学习天天向上我爱学习 str str replace 好好学习 System out pr
基于java-agent的监控

jolokia是一个基于java agent的监控
UUID工具类

import java util UUID public class Uuid public static String id32 String uuid UUID randomUUID toString uuid uuid replace
ehvierwer登录与不登录_《天涯明月刀手游》pc端手机端登录不进去如何解决服务器已满快速解决方法...

导读天涯明月刀这款手游终于公测了每个玩家都可以在这里创造属于自己的江湖世界不同的人会有不同的旅程所以想要拥有一段属于自己江湖旅程就一定不要错过天刀这款手游不过这款游戏刚公测有很多bug 不知道怎天涯明月刀这款手游终于公测了每
机器语言-＞汇编语言-＞高级语言

在硬件层面来看计算机的运行就是高底电压的变化这种高低电压的变化在早期是通过开关或插拔电线来控制的计算机中用0和1来表示低电压和高电压这些0和1的序列就可以控制计算机CPU进行各种动作一组一组的0 1序列就是一个一个的指令这些指令
springboot的日志管理

springboot的默认日志管理 SprongBoot使用的默认日志框架是Logback 并用INFO级别输出到控制台 SpringBoot的日志的级别有7个 TRACE DEBUG INFO WARN ERROR FATAL OFF 日
SAP创建采购申请的时候供货源信息不完整

如图所示原先该物料的对应的供应商的采购信息记录已经维护好货源清单也已经创建但是在ME51N创建采购申请的时候发现红色框的供应商是没显示出来的首先检查货源清单ME01 数据维护完整然后返回到ME11采购信息记录中发现有必填项没有维
【华为OD机试】最少面试官数 (C++ Python Java)2023 B卷

时间限制 C C 1秒其他语言 2秒空间限制 C C 262144K 其他语言524288K 64bit IO Format lld 题目描述某公司组织一场公开招聘活动假设由于人数和场地的限制每人每次面试的时长不等并已经安排给定
Layui框架的拖动上传以及时间选择器的基本使用

上传用的layui的点击or拖动上传其他上传也同理不喜勿喷欢迎补充上代码 html div class layui form item style width 1 div
使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

一下载示例 from huggingface hub import snapshot download repo id THUDM chatglm2 6b local dir chatglm2 6b cache dir local dir

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总： 的相关文章

随机推荐

热门标签

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：的相关文章