开源大模型资料总结

2023-11-18

基本只关注开源大模型资料，非开源就不关注了，意义也不大。

基座大模型：

LLaMA：7/13/33/65B，1.4T token

LLaMA及其子孙模型概述 - 知乎

GLM：6/130B，

ChatGLM基座：GLM（General Language Model）

GPT-J：

OPT：125M、350M、1.3B、2.7B、6.7B、13B、30B、66B、175B 9个不同的参数规模和版本，175B需要申请

BLOOM：BLOOM-560M、BLOOM-1.1B、BLOOM-1.7B、BLOOM-3B、BLOOM-7.1B

【LLM系列之BLOOM】BLOOM: 多语言大模型

对话大模型：

中文

chatglm，GLM，6B，中/英：

GitHub - LemonQu-GIT/ChatGLM-6B-Engineering: ChatGLM-6B Prompt Engineering Project

GitHub - yanqiangmiffy/InstructGLM: ChatGLM-6B 指令学习|指令数据|Instruct

https://github.com/liucongg/ChatGLM-Finetuning

GitHub - mymusise/ChatGLM-Tuning: 一种平价的chatgpt实现方案, 基于ChatGLM-6B + LoRA

GitHub - hiyouga/ChatGLM-Efficient-Tuning: Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调

BELLE，BLOOMZ，7B，中，instruction:1.5M

GitHub - LianjiaTech/BELLE: BELLE: Be Everyone's Large Language model Engine（开源中文对话大模型）

Guanaco，LLaMA，7B，中/英，instruction:534k，

Chinese-LLaMA-Alpaca，LLaMA，7/13B，中英，instruction:2/3M，

https://github.com/ymcui/Chinese-LLaMA-Alpaca

Luotuo，LLaMA，7/13B，中，instruction:52k

https://github.com/LC1332/Luotuo-Chinese-LLM

Phoenix，BLOOMZ，7B，中英，instruction:40+，conversation:40+

GitHub - FreedomIntelligence/LLMZoo: ⚡LLM Zoo is a project that provides data, models, and evaluation benchmark for large language models.⚡

HuatuoGPT，

Chinese-Vicuna：

GitHub - Facico/Chinese-Vicuna: Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案，结构参考alpaca

Ziya-LLaMA-13B-v1:

Linly LLaMa

“伶荔”(Linly) 开源大规模中文语言模型 - 知乎

Chinese chat T5:

GitHub - core-power/Chinese_Chat_T5_Base: 中文聊天小模型，用t5 base在大量数据上有监督。

Firefly，BLOOM

GitHub - yangjianxin1/Firefly: Firefly(流萤): 中文对话式大语言模型

英文：

Alpaca，LLaMA，7B，instrucation:52k，

Dolly，GPT-J，6B，intruction:52k，

https://github.com/databrickslabs/dolly

Vicuna，LLaMA，7/13B，conversation:70k，

GitHub - lm-sys/FastChat: An open platform for training, serving, and evaluating large languages. Release repo for Vicuna and FastChat-T5.

Koala，LLaMA，13B，instruction:355k，conversation:117k

成本不到100美元！UC伯克利再开源类ChatGPT模型「考拉」：数据量大没有用，高质量才是王道 - 知乎

BAIZE，LLaMA，7/13/30B，instruction:52k，conversation:111.5k

https://github.com/project-baize/baize-chatbot

Deepspeed Chat，OPT

DeepSpeed/README.md at master · microsoft/DeepSpeed · GitHub

多模态：

VPGTrans

VPGTrans: 用10%的成本定制一个你自己的GPT4多模态对话模型

MiniGPT-4:

GitHub - Vision-CAIR/MiniGPT-4: MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

LLaVA:

GitHub - haotian-liu/LLaVA: Large Language-and-Vision Assistant built towards multimodal GPT-4 level capabilities.

VisualGLM-6B:

GitHub - THUDM/VisualGLM-6B: Chinese and English multimodal conversational language model | 多模态中英双语对话语言模型

VisionLLM：

宣传下最新工作，VisionLLM - 知乎

MMGPT:

MMGPT (Multi-modal GPT) 安装指南和初体验 - 知乎

OpenFlamingo:

GitHub - mlfoundations/open_flamingo: An open-source framework for training large multimodal models.

X-LLM：

中科院发布多模态 ChatGPT，图片、语言、视频都可以 Chat ？中文多模态大模型力作

测评：

C-EVAL：

综述：

大语言模型调研汇总 - 知乎

最近大模型遍地开花，你在大模型实践过程中的经验有哪些？ - 知乎

GitHub - chenking2020/FindTheChatGPTer: ChatGPT爆火，开启了通往AGI的关键一步，本项目旨在汇总那些ChatGPT的开源平替们，包括文本大模型、多模态大模型等，为大家提供一些便利

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大模型多模态和生成

人工智能

开源大模型资料总结的相关文章

如何利用CHAT做简单的总结体会？

问CHAT 在测试过程中使用appium python自动化的优点和体会 CHAT回复使用 Appium 配合 Python 进行自动化测试主要有以下几点优点 1 跨平台性 Appium 支持 iOS 和 Android 平台的应用自动化
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
主流进销存系统有哪些？企业该如何选择进销存系统？

主流进销存系统有哪些企业该如何选择进销存系统永久免费的软件这个可能还真不太可能有而且就算有也只能说是相对免费因为要么就是数据存量有限要么就是功能有限数据信息都不保障并且功能不完全免费免费软件免费进销存诸如此类
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
对中国手机作恶的谷歌，印度CEO先后向三星和苹果低头求饶

日前苹果与谷歌宣布合作发布了 Find My Device Network 的草案旨在规范蓝牙追踪器的使用在以往苹果和谷歌的生态形成鲜明的壁垒各走各路如今双方竟然达成合作发生了什么事首先是谷歌安卓系统的市场份额显著下滑数年来
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating

随机推荐

值得推荐的13款可视化软件，快收藏！

数据可视化力求用图表结合的方式把所有的数据整合在某一图像上这样呈现在观众眼前的画面不仅仅是美观且比以往长篇大论或是密密麻麻的数据表格更直观易懂更便于观察分析到今年上半年为止国内外已经有了很多发展的较好的数据可视化软件接下来给大家
12. 数据类型 - 集合详解

Hi 大家好我是茶桁通过最近几节课的内容我们已经了解到了大部分的容器类数据的特性和应用今天这一节课是容器类数据的最后一部分让我们今天来详细了解一下集合集合是确定的一组无序的数据的组合注意这一句话中的几个概念首先是确定的
怎么讲服务器上的文件装进电脑,怎么把电脑文件放进云服务器

怎么把电脑文件放进云服务器内容精选换一换 Winscp无法连接到服务器 SSH连接工具例如Xshell可以正常连接云服务器其他SSH工具连接云服务器正常但是Winscp无法连接到服务器说明SSH服务是没有问题的 Winscp连接基
使用notepad++批量在每行首尾添加内容

1 简介在程序员开发过程中一个不错的工具是notepad 该工具为notepad的增强增强了许多的功能包括程序员喜欢的列块编辑模式支持众多的插件例如json格式化支持markdown语法一种场景是这样的比如说上传的工资单中
TortoiseGit(小乌龟)设置保存账号密码

在我们使用Tortoise git 时默认是需要在每次提交代码时输入你的账号和密码的这样在实际使用时会觉得非常繁琐且费时于是我们可以简单设置下配置文件便可保存下账号密码下次在使用时就不必再次手动输入点击 Git 选项然后点击右
C-NOIP1998P3 二的幂次方

include
ARMV8体系结构简介：exclusive monitor

为了支持exclusive操作硬件会增加exclusive monitor来支持一 exclusive monitor exclusive monitor分为2类 local monitor 实现在cpu内部针对cacheable属性
Android 图像模糊处理

近期接触到了图像模糊处理用了一些办法可以实现但交互效果不好在Github上找到的试了一些办法觉得还是以下方法比较靠谱大致分为两种一种是RenderScript 一种是国外提供的一种高斯算法上代码来看看首先来看看andr
西门子PLC S7-1200程序实例西门子1200与安川机器人TCP/IP通讯，包含机器人GSD文件

西门子PLC S7 1200程序实例博图版本V15 仅供电气编程者学习借鉴 1 西门子1200与安川机器人TCP IP通讯包含机器人GSD文件 2 西门子1200控制6轴伺服电机四台台脉冲控制台达B2伺服两台PN通讯控制西门子V90
Python 新手入门学习教程、第三方库以及开发工具整合（持续更新）

目录一学习教程 1 python 系统学习教程 python 菜鸟教程真的挺全面接口讲解比较全面且有例子参考通俗易懂入门必备 2 python api接口文档官方 python api接口标准库所有的api接口解释非常详细
算法学习之二分查找

个人主页勇敢的小牛儿推荐专栏 C语言知识点座右铭敢于尝试才有机会今日鸡汤 Is the true wisdom fortitude ambition Napoleon 真正的才智是刚毅的志向拿破仑目录一二分查找法介绍二
JAVA单元测试框架-13-TestNG中的Listener监听

使用TestNG中的Listener完成监听测试通过实现ITestListener里面的方法完成测试过程监听 public class TestListenner implements ITestListener Override pub
浮点数转化为字符串存进数组模块分享（自动保留到小数点后一位）

目录一使用说明二模块代码三代码讲解四作者的话一使用说明 1 数据格式浮点数可以为整数部分不超过3位的所有浮点数数组格式只能设置为下面这一种 unsigned char fnums 5 0 a 0 用于存放正负 1表示
面向对象编程是什么意思呢？汇总

https blog csdn net qq 32381815 article details 79119996 面向对象思想谈谈你对面向对象的理解 https blog csdn net qsbbl article details 71
Altium Designer20快捷键整理合集

花了点时间整理了一下平常经常用到的一些AD20的快捷键操作自用可取经过验证均可用原理图 PCB通用快捷键保存 CTRL S 打开 CTRL O 关闭 CTRL F4 打印 CTRL P 退出 ALT F4 项目打包 C P 文档切换
UnrealEngine4初始设置及个人使用崩溃记录

日志 1 第一次记录 2020 2 05 版本 4 24 2 UnrealEngine的初始设置 1 在Epic中下载UnrealEngine4之后 1 1 首先启动选项 1 2 接着勾选输入调试用符号应用以后出现新的崩溃问题
vue3中如何循环本地图片
eNSP实验：DHCP&&安全区域&&安全策略&&静态路由

解题思路 1 先给各个接口以及server1服务器配置好地址 2 连接Cloud云利用物理 web 防火墙方便操作只用命令行的情况下可以不用这个方法 3 利用DHCP给各个方向接口的PC自动分配好地址 4 利用静态路由的方法将两个防
VimFoundation

模式 vim 分为两种模式 1 命令模式 2 编辑模式命令模式 i 进入编辑模式 w 保存 q 退出强制 syntax on 打开语法高亮 set number 显示行号 cc 剪切当前行 pp 粘贴到当前行 u 撤销3武器3 yy 复
开源大模型资料总结

基本只关注开源大模型资料非开源就不关注了意义也不大基座大模型 LLaMA 7 13 33 65B 1 4T token LLaMA及其子孙模型概述知乎 GLM 6 130B ChatGLM基座 GLM General Languag

开源大模型资料总结

开源大模型资料总结 的相关文章

随机推荐

热门标签

开源大模型资料总结的相关文章