ChatGPT开源系列

2023-11-10

目录

进化树

从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么?

模型

Stanford Alpaca

可以借鉴的点

llama.cpp

验证阶段已完成

nebullvm-chatllama(待定)

可以借鉴的点

OpenChatKit

可以借鉴的点:

ChatGLM

可以借鉴的点

应用

QA系统

分类任务

其他任务


进化树

基础模型

GPT-4 之后

从GPT-4 可以看出未来 LLM 的哪些趋势?未来的研发方向和优化策略是什么?


 

1)闭源趋势

网友戏称 OpenAI 已沦为 Closed AI。毕竟从 GPT1 到 GPT-4,模型各类细节越来越闭源和黑盒,大模型战场的竞争因素决定了 GPT-4 类的第一梯度模型可能会越来越封闭,成为技术门槛。

2)「Self Instruct」模式

其核心是:中小模型+大模型生产指令数据的「LLaMA 7B + text-davinci-003」模式。中小参数的模型在成本上,是更靠近实际落地的方式。要知道 llama.cpp 可以在 Pixel 6 手机上运行。通过该模式精调过的 Alpaca,效果接近普通 GPT3.5。

3)模型结合

更多模态、更多形态结合 ChatGPT 类模型包括 Kosmos-1 和具身智能 PaLM-E,同时从听、说、看、触等全方位结合,形成类似真正智能体的概念。

4)模型加速和降低成本

这会是持续关注的方向,包括从训练、推理等多层面考量。


 


 

5)能力预测

这是很重要的方向。即用小模型来预测广泛大模型的能力,极大减少试错成本,提升训练效率。

6)开源评测框架

这对于 LLM 的评测具有重大意义,可以快速发现改进方向。

模型

Stanford Alpaca

基于LLaMA.

Alpaca是由Meta的LLaMA 7B微调而来的全新模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。在8个80GB A100上训练了3个小时,不到100美元;生成数据(开放)使用OpenAI的API,500美元。

可以借鉴的点

  1. self-instruct

  1. 数据集示例
  2. 微调代码已放出,微调后的模型没有开源

推理代码可以参考 llama本身

llama.cpp

基于LLaMA.

在苹果M1/M2芯片上跑LLaMA,130亿参数模型仅需4GB内存,LeCun转赞

优势:c++编译

后续可以再尝试lora版本 有说效果更好 且模型效果更小

训练参考

lora原理

验证阶段已完成

  • 中文数据微调,验证方法可行性。
    • 具体做法:
      • 生成中文种子任务,让ChatGPT生成数据。用了10w的数据去微调

nebullvm-chatllama(待定)

基于LLaMA.

在做一个框架的事情 要集成各个模型进来

  1. 主要参考数据准备阶段
  2. 三阶段提供微调方法

微调脚本

3.推理模块还在开发中

可以借鉴的点

  1. 训练成本

  1. 数据集制作方法

OpenChatKit

基于GPT系列

  • 一个参数量达 20B 的开源模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,在 4300 万条指令上进行了微调;
  • 一个参数量达 60 亿的审核模型(moderation model),可以帮模型过滤不当内容;
  • 一个可扩展的检索系统,可以帮模型检索维基百科等资源库,从而给出最新信息。

可以借鉴的点:

  1. 有训练模块
  2. 有推理模块
  3. 数据准备阶段。数据格式类似OpenAI

在社区中看到训练资源

ChatGLM

基于GLM (清华)

清华开源 千亿基座的对话模型开启内测,对应单卡版本开源

  1. 无官方微调模块,但有其他开源替代方案
  2. 有推理模块
  3. 低成本部署
  4. 数据样本参考开源的方式

可以借鉴的点

  1. 量化,低成本部署,单卡部署

租服务器

应用

qa结合embedding。azure

阿里opensearch 内容社区实现

QA系统

分类任务

有那么多的embedding为什么gpt那么优秀

其他任务


最难的是工程化(技术方案产品落地的的能力),怎么能更好的把各种技术栈堆叠在一起(可能一个功能背后是多个功能/技术栈的结合),且能够无缝连接(把技术点用产品的交互来实现,让用户用最少的理解/使用成本,完成复杂度较高的任务),最后实现一个很好的效果。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT开源系列 的相关文章

随机推荐

  • 机器学习洞察

    在之前的 机器学习洞察 系列文章中 我们分别针对于多模态机器学习和分布式训练 无服务器推理进行了解读 本文将为您重点介绍 JAX 的发展并剖析其演变和动机 下面 就让我们来认识一下 JAX 这一新崛起的深度学习框架 亚马逊云科技开发者社区为
  • Jenkins安装配置及插件安装使用

    个人理解持续集成 为解决程序代码提交质量低 提交内容导致原有系统的BUG 按时或按需自动编译版本 进行自动化测试 百度对持续集成的定义 持续集成是一种软件开发实践 即团队开发成员经常集成他们的工作 通常每个成员每天至少集成一次 也就意味着每
  • MySQL监控工具PMM

    MySQL监控工具PMM PMM 安装server端 添加agent 配置agent 添加MySQL监控 查看客户端组件状态 大致内容 参考链接 PMM PMM Percona Monitoring and Management 是一个免费
  • qTip2 Events

    author YHC 绑定事件 这个API触发一些特殊的事件 以下详细信息 允许你给qTip分配多个时间监听 和为某一事件做出响应 例如 我们绑定一个事件句柄 它将侦听qTip的移动的事件 和更新DIV元素里面显示的qTip的坐标内容 se
  • 【满分】【华为OD机试真题2023 JS】微服务的集成测试

    华为OD机试真题 2023年度机试题库全覆盖 刷题指南点这里 微服务的集成测试 知识点深搜 时间限制 1s 空间限制 256MB 限定语言 不限 题目描述 现在有n个容器服务 服务的启动可能有一定的依赖性 有些服务启动没有依赖 其次服务自身
  • 现在公司都不缺人了?软件测试工作经历3年,居然被坑了?防不胜防!

    我的情况 大概介绍一下个人情况 女 本科 三年多测试工作经验 懂python 会写脚本 会selenium 会性能 然而到今天都没有收到一份offer 从年后就开始准备简历 年后上班的第一天就开始投 开始只是投了一些官网已久的岗位 并没有收
  • Keras中model.evaluate()返回的是 loss value & metrics values

    Keras官方文档 https keras io models model evaluate Keras中model evaluate 返回的是 损失值和你选定的指标值 例如 精度accuracy evaluate evaluate x N
  • Spring事务管理: 构建稳健的数据库事务处理

    博主猫头虎 带您 Go to New World 博客首页 猫头虎的博客 面试题大全专栏 文章图文并茂 生动形象 简单易学 欢迎大家来踩踩 IDEA开发秘籍专栏 学会IDEA常用操作 工作效率翻倍 100天精通Golang 基础入门篇 学会
  • SpringBoot入门到精通(四):整合JDBC和JPA

    整合JDBC JdbcTemplate JPA 当前环境说明 Windows10 64 Maven3 x JDK1 8 MySQL5 6 SpringToolSuite4 Spring官方提供的开发工具 实际就是一个Eclipse 一 整合
  • 必看!!!客户端requests与服务端request收发请求

    当使用代码进行接口访问的时候 请求的发送与请求的接受使用的参数应该怎么如何传输能够请求到正确的响应呢 一 使用GET请求发送 客户端与服务端的参数传输与接受 1 服务端 首先使用web框架写一个简单的接口 接收两个参数 page和size
  • 网络原理TCP/UDP

    文章目录 TCP TCP协议段格式 可靠机制 确认应答机制 超时重传机制 连接管理机制 建立连接 三次握手 断开连接 四次挥手 常见问题 效率机制 滑动窗口 流量控制机制 拥塞控制 延迟应答 捎带应答 粘包问题 应用层的数据包 TCP与UD
  • 源码(二进制)安装kuberbetes(k8s) (完整版-持续完善)

    环境配置 1 分别设置hostname hostnamectl set hostname master hostnamectl set hostname node01 hostnamectl set hostname node02 2 主机
  • 从42亿个不重复的4字节整数中判断一个数是否存在

    include
  • RuoYi项目中VUE表单修改表单中数据回显下拉选项或者单选出现异常

    若依项目中有一个功能就是字典 字典可以让我们不需要修改前端代码的情况下实现表单中下拉选项文字 单选 多选按钮的文字变更 但也会遇到各种各样的问题 后端传递的某个字段的值是数字类型的值 但是字典里面的确实字符串的值 不可能让后端传递字符串的值
  • OpenCV实现SfM(一):双目三维重建(包含SIFT特征点提取)

    三维重建介绍 三维重建是指根据基于一个视图或者多个视图所获得的物体或者场景的图像重建三维模型的过程 由于单视图的信息很单一 因此三维重建需要更复杂的算法和过程 相比之下 多视图的三维重建 模仿人类观察世界的方式 就比较容易实现 其方法是先对
  • Uni-App开发框架介绍

    Uni App开发框架介绍 1 Uni App简介 Uni App是一家公司 DCloud 产品 公司承诺将一直开源且免费 公司旗下有4个产品 HBuilder X 开发工具 uni app 跨平台统一框架 uniCloud 云服务提供商
  • 浏览器的事件轮询(消息轮询)

    目录 浏览器的进程模型 何为进程 何为线程 浏览器有哪些进程和线程 渲染主线程是如何 作的 相关问题 何谓异步 JS为什么会阻塞渲染 JS 中的计时器为什么无法精确计时 任务队列与优先级 浏览器的进程模型 何为进程 程序运 需要有它 专属的
  • 【AI with ML】第 11 章 :对序列模型使用卷积和递归方法

    大家好 我是Sonhhxg 柒 希望你看完之后 能对你有所帮助 不足请指正 共同学习交流 个人主页 Sonhhxg 柒的博客 CSDN博客 欢迎各位 点赞 收藏 留言 系列专栏 机器学习 ML 自然语言处理 NLP 深度学习 DL fore
  • 操作系统复习【南邮】

    声明 操作系统系列只针对南邮操作系统课程重点进行梳理 尽量不要作为考研复习资料 可能会有缺失之类 也恳请读者进行批评指正 共同进步 参考教材 操作系统教程 人民邮电出版社 黄刚 徐小龙 段卫华编著 2009 9
  • ChatGPT开源系列

    目录 进化树 从GPT 4 可以看出未来 LLM 的哪些趋势 未来的研发方向和优化策略是什么 模型 Stanford Alpaca 可以借鉴的点 llama cpp 验证阶段已完成 nebullvm chatllama 待定 可以借鉴的点