两大可商用开源大模型同时发布!性能不输LLaMA,羊驼家族名字都不够用了

2023-05-16

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

从Meta的LLaMA发展出的羊驼家族一系列大模型,已成为开源AI重要力量。

但LLamA开源了又没全开,只能用于研究用途,还得填申请表格等,也一直被业界诟病。

好消息是,两大对标LLaMA的完全开源项目同时有了新进展。

可商用开源大模型来了,还一下来了俩:

MosaicML推出MPT系列模型,其中70亿参数版在性能测试中与LLaMA打个平手。

7c0a82c89e6d92f5fa841acab8eac406.png

Together的RedPajama(红睡衣)系列模型,30亿参数版在RTX2070游戏显卡上就能跑。

a2033aad37dc4c8e08b57127a5a8ee8a.png

对于这些进展,特斯拉前AI主管Andrej Karpathy认为,开源大模型生态有了寒武纪大爆发的早期迹象。

d71cb31974a5a128b7b0fb0025ace6a7.png

MPT,与LLaMA五五开

MPT系列模型,全称MosaicML Pretrained Transformer,基础版本为70亿参数。

MPT在大量数据(1T tokens)上训练,与LLaMA相当,高于StableLM,Pythia等其他开源模型。

支持84k tokens超长输入,并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。

在各类性能评估中,与原版LLaMA不相上下。

3ffd7b5a307ae5d653b49ff5e97d35dd.png

除了MPT-7B Base基础模型外还有三个变体。

MPT-7B-Instruct,用于遵循简短指令。

MPT-7B-Chat,用于多轮聊天对话。

MPT-7B-StoryWriter-65k+,用于阅读和编写故事,支持65k tokens的超长上下文,用小说数据集微调。

MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办。

e27892509e26b0ce9bbf8e45fd678292.png

该公司致力于降低训练神经网络的成本,推出的文本和图像生成推理服务成本只有OpenAI的1/15。

0b82918ae946c97b4cbb759473f6fe8c.png

RedPajama,2070就能跑

RedPajama系列模型,在5TB的同名开源数据上训练而来(前面提到的MPT也是用此数据集训练)。

除70亿参数基础模型外,还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。

目前70亿版本完成了80%的训练,效果已经超过了同规模的Pythia等开源模型,略逊于LLamA。

723fd04f79e2ffb4b813e731c3f7f25e.png

预计在完成1T tokens的训练后还能继续改进。

dda1e0fde3d321750e70e30102c06dbd.png

背后公司Together,由苹果前高管Vipul Ved Prakash,斯坦福大模型研究中心主任Percy Liang,苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后,他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。

a62510dffdc150faa0c939bdf39fa3e4.png

One More Thing

来自南美洲的无峰驼类动物一共4种,已被各家大模型用完了。

5998637ad638b1e9693d7c47bcf2fac9.png

Meta发布LLaMA之后,斯坦福用了Alpaca,伯克利等单位用了Alpaca,Joseph Cheung等开发者团队用了Guanaco。

以至于后来者已经卷到了其他相近动物,比如IBM的单峰骆驼Dromedary,Databricks的Dolly来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的神兽,如UCSD联合中山大学等推出的白泽。

344c51022d631c117d032946b65a9718.png

港中文等推出的凤凰……

3e4ac07fc00f404e43d35df251c7bf12.png

最绝的是哈工大基于中文医学知识的LLaMA微调模型,命名为华驼

92737d0cdf5e82f85772a3bcfa9659e4.png

参考链接:
[1] https://www.mosaicml.com/blog/mpt-7b
[2]https://www.together.xyz/blog/redpajama-models-v1
[3]https://twitter.com/karpathy/status/1654892810590650376?s=20

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入交流群,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~

5bb75fa43a0f257435ec8b51db0c0096.jpeg

点这里👇关注我,记得标星哦~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

两大可商用开源大模型同时发布!性能不输LLaMA,羊驼家族名字都不够用了 的相关文章

  • IOS+openfire 即时通讯

    最近看到很多人在琢磨ios即时通讯这块 xff0c 于是出去好奇 xff0c 决定动手试试 xff0c 今天就先从xmpp这个框架来尝试 其实xmpp也就一个协议而已 xff0c 更多人还是喜欢把它叫做Jabber 首先还是提供一下下载地址
  • webpack进行js打包,引入js

    node中html引入jquery可以用webpack进行打包 webpack 3可以打包 xff0c webpack 4 打包需要安装webpack cli xff0c 否则会报错 直接引入js会报错 语法错误 xff0c 浏览器不支持E
  • iOS中UICollectionView(集合视图)的使用

    1 简单介绍与说明 简介 UICollectionView提供了一种自定义布局展示试图内容的方式 说明 涉及到的必须的基本类型与基本代理类型有UICollectionView UICollectionViewCell UICollectio
  • iOS表视图之增删单元格

    要进行单元格的修改 xff0c 首先我们要删除原来的视图并从对象库中拖曳一个Navigation Controller视图 xff08 导航控制器 xff09 到设计页面 xff0c 添加Navigation Controller视图的同时
  • 史上最全IOS的touch事件手势使用方法

    以下内容源于本人整理 部分来源于网络 如有侵权行为或错误之处还望指正 请联系邮箱huiyutianshi 64 qq com 关于touch事件的 手势和事件都是基于UIRrsponder的 UIResponder包含所有的响应事件 触摸
  • vtk 显示效果设置

    在vtk中 xff0c 显示样式的显示 xff0c 是通过vtkProperty来控制的 xff0c 这里介绍三种基本的属性设置方式 xff0c 点方式 xff0c 网格方式和面方式 xff0c 这里以 头像三角网格的显示为例介绍其显示 其
  • Qt 线程(一) Qt 多线程实现的两种方式 线程实现详解

    简述两种实现方式 Qt提供了一个管理线程的类 xff1a QThread 子类化QThread并重新实现run 使用worker object通过QObject moveToThread将它们移动到线程中 简介QThread类 一 公共槽函
  • 1000以内的完数

    题目 xff1a 一个数如果恰好等于它的因子之和 xff0c 这个数就称为 完数 例如 xff0c 6的因子为1 2 3 xff0c 而6 61 1 43 2 43 3 xff0c 因此6是 完数 编程找出1000之内的所有完数 xff0c
  • 自适应参数的DE算法——JADE,L-SHADE

    目录 JADELSHADE参考文献 最近复写一个DE 1 xff08 差分进化算法 xff09 参数的自适应策略的变体L SHADE 2 xff08 CEC冠军算法 xff09 的matlab版本 xff0c 发现其提出的自适应策略对DE改
  • 转:基于科大讯飞语音API语音识别开发详解

    原文来自于 xff1a http www 52wulian org android voice 最近项目需要用到android语音识别 xff0c 立马就想到科大讯飞 xff0c 结合官方实例及阅读API文档 xff0c 初步的完成了And
  • 离线语音识别_离线语音识别库_离线语音识别sdk - 云+社区 - 腾讯云

    广告关闭 2017年12月 xff0c 云 43 社区对外发布 xff0c 从最开始的技术博客到现在拥有多个社区产品 未来 xff0c 我们一起乘风破浪 xff0c 创造无限可能 是的 xff0c 录音文件识别服务就是离线语音识别服务 录音
  • python在线发音-Python如何实现文本转语音

    准备 我测试使用的Python版本为2 7 10 xff0c 如果你的版本是Python3 5的话 xff0c 这里就不太适合了 使用Speech API 原理 我们的想法是借助微软的语音接口 xff0c 所以我们肯定是要进行调用 相关的接
  • micropython和python区别-MicroPython与Python速度对比

    首先说明 xff0c micropython跟python是没有任何可比性的 xff0c python作为一种通用的语言 xff0c 在扩展性上不是micropython能比的 xff0c 比如大量的库 xff0c 可以方便的用C语言加模块
  • python代码写好了怎么运行-python的代码写在哪里,怎么样运行python代码

    1 python的代码写在哪里 你有两种方式写python代码 xff0c 他们针对不同的应用场景在python交互式解释器里写代码 在编辑器里写代码 在python交互式解释器里 xff0c 你可以写简单的代码 xff0c 尽管复杂的代码
  • micropython入门教程-Micropython入门实操心得

    1 用串口线连接pyboard和电脑 xff0c 发现开发板被识别为移动磁盘 2 移动磁盘中默认会有4个文件 xff0c 它们分别是 xff1a boot py xff1a 开机最先运行的文件 xff0c 最后会由它加载main py ma
  • micropython和python区别-(一)什么是MicroPython?

    MicroPython简介 MicroPython是Python 3编程语言的精简高效实现 xff0c 包括Python标准库的一小部分 xff0c 并且经过优化 xff0c 可在微控制器和受限环境中运行 MicroPython pyboa
  • vmwate虚拟机centos7安装后重启输入密码提示:sorry,that didn't work.please try again

    遇到过一次 原因很简单 在centos图形界面设置密码时 xff0c 带有大小写的部分会出问题 如果有大写请直接用小写就可以避免 解决方案 一 进入单用户模式 1 重起电脑 xff0c 进入内核选择界面 按上下避免自动进入 2 选择要内核并
  • vue3 main.js 引入axios 的方法(如图)

  • 远程电脑复制粘贴用不了怎么解决?

    品牌型号 xff1a HP ENVY NoteBook 系统 xff1a win7旗舰版 软件版本 xff1a AnyDesk 相信在使用电脑远程的过程中 xff0c 很多人都会遇到各种各样的问题 xff0c 有好解决的有不好解决的 xff
  • centOS 关闭图形界面

    1 临时关闭 在console中输入 init 3 2 更改默认的启动方式 推荐使用这种方式更改 xff0c 相较直接更改配置文件更美好 xff08 新版本的CentOS 系统里使用 targets 取代了运行级别的概念 系统有两种默认的

随机推荐