开源大模型资料总结

2023-11-18

基本只关注开源大模型资料,非开源就不关注了,意义也不大。

基座大模型:

LLaMA:7/13/33/65B,1.4T token 

LLaMA及其子孙模型概述 - 知乎

GLM:6/130B,

ChatGLM基座:GLM(General Language Model)

GPT-J:

OPT:125M、350M、1.3B、2.7B、6.7B、13B、30B、66B、175B 9个不同的参数规模和版本,175B需要申请

BLOOM:BLOOM-560M、BLOOM-1.1B、BLOOM-1.7B、BLOOM-3B、BLOOM-7.1B

【LLM系列之BLOOM】BLOOM: 多语言大模型

对话大模型:

中文

chatglm,GLM,6B,中/英:

GitHub - LemonQu-GIT/ChatGLM-6B-Engineering: ChatGLM-6B Prompt Engineering Project

GitHub - yanqiangmiffy/InstructGLM: ChatGLM-6B 指令学习|指令数据|Instruct

https://github.com/liucongg/ChatGLM-Finetuning

GitHub - mymusise/ChatGLM-Tuning: 一种平价的chatgpt实现方案, 基于ChatGLM-6B + LoRA

GitHub - hiyouga/ChatGLM-Efficient-Tuning: Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调

BELLE,BLOOMZ,7B,中,instruction:1.5M

GitHub - LianjiaTech/BELLE: BELLE: Be Everyone's Large Language model Engine(开源中文对话大模型)

Guanaco,LLaMA,7B,中/英,instruction:534k,

Chinese-LLaMA-Alpaca,LLaMA,7/13B,中英,instruction:2/3M,

https://github.com/ymcui/Chinese-LLaMA-Alpaca

Luotuo,LLaMA,7/13B,中,instruction:52k

https://github.com/LC1332/Luotuo-Chinese-LLM

Phoenix,BLOOMZ,7B,中英,instruction:40+,conversation:40+

GitHub - FreedomIntelligence/LLMZoo: ⚡LLM Zoo is a project that provides data, models, and evaluation benchmark for large language models.⚡

HuatuoGPT,

Chinese-Vicuna:

GitHub - Facico/Chinese-Vicuna: Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca

Ziya-LLaMA-13B-v1:

Linly LLaMa

“伶荔”(Linly) 开源大规模中文语言模型 - 知乎

Chinese chat T5:

GitHub - core-power/Chinese_Chat_T5_Base: 中文聊天小模型,用t5 base在大量数据上有监督。

Firefly,BLOOM

GitHub - yangjianxin1/Firefly: Firefly(流萤): 中文对话式大语言模型

英文:

Alpaca,LLaMA,7B,instrucation:52k,

Dolly,GPT-J,6B,intruction:52k,

https://github.com/databrickslabs/dolly

Vicuna,LLaMA,7/13B,conversation:70k,

GitHub - lm-sys/FastChat: An open platform for training, serving, and evaluating large languages. Release repo for Vicuna and FastChat-T5.

Koala,LLaMA,13B,instruction:355k,conversation:117k

成本不到100美元!UC伯克利再开源类ChatGPT模型「考拉」:数据量大没有用,高质量才是王道 - 知乎

BAIZE,LLaMA,7/13/30B,instruction:52k,conversation:111.5k

https://github.com/project-baize/baize-chatbot

Deepspeed Chat,OPT

DeepSpeed/README.md at master · microsoft/DeepSpeed · GitHub

多模态:

VPGTrans

VPGTrans: 用10%的成本定制一个你自己的GPT4多模态对话模型

MiniGPT-4:

GitHub - Vision-CAIR/MiniGPT-4: MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

LLaVA:

GitHub - haotian-liu/LLaVA: Large Language-and-Vision Assistant built towards multimodal GPT-4 level capabilities.

VisualGLM-6B:

GitHub - THUDM/VisualGLM-6B: Chinese and English multimodal conversational language model | 多模态中英双语对话语言模型

VisionLLM:

宣传下最新工作,VisionLLM - 知乎

MMGPT:

MMGPT (Multi-modal GPT) 安装指南和初体验 - 知乎

OpenFlamingo:

GitHub - mlfoundations/open_flamingo: An open-source framework for training large multimodal models.

X-LLM:

中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作

测评:

C-EVAL:

 

综述:

大语言模型调研汇总 - 知乎

最近大模型遍地开花,你在大模型实践过程中的经验有哪些? - 知乎

GitHub - chenking2020/FindTheChatGPTer: ChatGPT爆火,开启了通往AGI的关键一步,本项目旨在汇总那些ChatGPT的开源平替们,包括文本大模型、多模态大模型等,为大家提供一些便利

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

开源大模型资料总结 的相关文章

随机推荐

  • 值得推荐的13款可视化软件,快收藏!

    数据可视化力求用图表结合的方式把所有的数据整合在某一图像上 这样呈现在观众眼前的画面不仅仅是美观 且比以往长篇大论或是密密麻麻的数据表格更直观易懂 更便于观察分析 到今年上半年为止 国内外已经有了很多发展的较好的数据可视化软件 接下来给大家
  • 12. 数据类型 - 集合详解

    Hi 大家好 我是茶桁 通过最近几节课的内容 我们已经了解到了大部分的容器类数据的特性和应用 今天这一节课是容器类数据的最后一部分 让我们今天来详细了解一下 集合 集合是确定的一组无序的数据的组合 注意这一句话中的几个概念 首先是 确定的
  • 怎么讲服务器上的文件装进电脑,怎么把电脑文件放进云服务器

    怎么把电脑文件放进云服务器 内容精选 换一换 Winscp无法连接到服务器 SSH连接工具例如Xshell可以正常连接云服务器 其他SSH工具连接云服务器正常 但是Winscp无法连接到服务器 说明SSH服务是没有问题的 Winscp连接基
  • 使用notepad++批量在每行首尾添加内容

    1 简介 在程序员开发过程中 一个不错的工具是notepad 该工具为notepad的增强 增强了许多的功能 包括程序员喜欢的列块编辑模式 支持众多的插件 例如json格式化 支持markdown语法 一种场景是这样的 比如说上传的工资单中
  • TortoiseGit(小乌龟)设置保存账号密码

    在我们使用Tortoise git 时 默认是需要在每次提交代码时输入你的账号和密码的 这样在实际使用时会觉得非常繁琐且费时 于是我们可以简单设置下配置文件 便可保存下账号密码 下次在使用时就不必再次手动输入 点击 Git 选项 然后点击右
  • C-NOIP1998P3 二的幂次方

    include
  • ARMV8体系结构简介:exclusive monitor

    为了支持exclusive操作 硬件会增加exclusive monitor来支持 一 exclusive monitor exclusive monitor分为2类 local monitor 实现在cpu内部 针对cacheable属性
  • Android 图像模糊处理

    近期接触到了图像模糊处理 用了一些办法可以实现但交互效果不好 在Github上找到的 试了一些办法 觉得还是以下方法 比较靠谱 大致分为两种 一种是RenderScript 一种是国外提供的一种 高斯算法 上代码 来看看 首先来看看andr
  • 西门子PLC S7-1200程序实例 西门子1200与安川机器人TCP/IP通讯,包含机器人GSD文件

    西门子PLC S7 1200程序实例 博图版本V15 仅供电气编程者学习借鉴 1 西门子1200与安川机器人TCP IP通讯 包含机器人GSD文件 2 西门子1200控制6轴伺服电机 四台台脉冲控制台达B2伺服 两台PN通讯控制西门子V90
  • Python 新手入门学习教程、第三方库以及开发工具整合(持续更新)

    目录 一 学习教程 1 python 系统学习教程 python 菜鸟教程 真的挺全面 接口讲解比较全面且有例子参考 通俗易懂 入门必备 2 python api接口文档 官方 python api接口标准库 所有的api接口解释非常详细
  • 算法学习之二分查找

    个人主页 勇敢的小牛儿 推荐专栏 C语言知识点 座右铭 敢于尝试才有机会 今日鸡汤 Is the true wisdom fortitude ambition Napoleon 真正的才智是刚毅的志向 拿破仑 目录 一 二分查找法介绍 二
  • JAVA单元测试框架-13-TestNG中的Listener监听

    使用TestNG中的Listener完成监听测试 通过实现ITestListener里面的方法完成测试过程监听 public class TestListenner implements ITestListener Override pub
  • 浮点数转化为字符串存进数组模块分享(自动保留到小数点后一位)

    目录 一 使用说明 二 模块代码 三 代码讲解 四 作者的话 一 使用说明 1 数据格式 浮点数可以为整数部分不超过3位的所有浮点数 数组格式只能设置为下面这一种 unsigned char fnums 5 0 a 0 用于存放正负 1表示
  • 面向对象编程是什么意思呢?汇总

    https blog csdn net qq 32381815 article details 79119996 面向对象思想 谈谈你对面向对象的理解 https blog csdn net qsbbl article details 71
  • Altium Designer20快捷键整理合集

    花了点时间整理了一下平常经常用到的一些AD20的快捷键操作 自用可取 经过验证均可用 原理图 PCB通用快捷键 保存 CTRL S 打开 CTRL O 关闭 CTRL F4 打印 CTRL P 退出 ALT F4 项目打包 C P 文档切换
  • UnrealEngine4初始设置及个人使用崩溃记录

    日志 1 第一次记录 2020 2 05 版本 4 24 2 UnrealEngine的初始设置 1 在Epic中下载UnrealEngine4之后 1 1 首先 启动 选项 1 2 接着 勾选 输入调试用符号 应用 以后出现新的崩溃问题
  • vue3中如何循环本地图片

  • eNSP实验:DHCP&&安全区域&&安全策略&&静态路由

    解题思路 1 先给各个接口以及server1服务器配置好地址 2 连接Cloud云 利用物理 web 防火墙 方便操作 只用命令行的情况下可以不用这个方法 3 利用DHCP给各个方向接口的PC自动分配好地址 4 利用静态路由的方法 将两个防
  • VimFoundation

    模式 vim 分为两种模式 1 命令模式 2 编辑模式 命令模式 i 进入编辑模式 w 保存 q 退出 强制 syntax on 打开语法高亮 set number 显示行号 cc 剪切当前行 pp 粘贴到当前行 u 撤销3武器3 yy 复
  • 开源大模型资料总结

    基本只关注开源大模型资料 非开源就不关注了 意义也不大 基座大模型 LLaMA 7 13 33 65B 1 4T token LLaMA及其子孙模型概述 知乎 GLM 6 130B ChatGLM基座 GLM General Languag