Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!

2023-11-04

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

金磊 发自 凹非寺
转载自:量子位(QbitAI)

万万没想到,以文生图著名的Stable Diffusion,也入局了大语言模型(LLM)之战。

它背后的公司Stability AI,正式推出类ChatGPT产品——StableLM

https://github.com/Stability-AI/StableLM

fd59233d0647d25c7deac9efa679c9ed.png
由Stable Diffusion XL生成

据了解,这个模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿;后续还将推出150亿到650亿参数模型。

aea0a90a2e78b80806d1304bcbaabf5d.png

而且不到一天时间,在GitHub上开源的项目便已经揽获了超4K颗星,火爆程度可见一斑。

ef00541d89f4f95ff1c758c9ba04123c.jpeg

原本大语言模型之战再添玩家应当是一件令人兴奋的事情。

但结果竟也是一个万万没想到的大反转。

网友们在体验了StableLM之后,毫不留情地给出这样的评价:

非常糟糕。

f8264a7a3933b4d6754451aa42753883.png

StableLM真的有那么不堪吗?

能对话,也能生成代码

我们先来看下StableLM所展示出来的能力。

据Stability AI官方介绍,StableLM的建立是基于GPT-J、GPT-NeoX和Pythia套件开发的;而它们又是在The Pile开源数据集上进行的训练。

但StableLM与上述模型有所不同,它采用了The Pile的新数据集,与此前相比,足足大了三倍,并且包含1.5万亿个token。

除了基本情况的介绍之外,Stabliity AI也给出了几个demo。

例如在对话方面,若是提问“你会对即将高中毕业的朋友说些什么”,StableLM会回答:

应该为自己和取得的成绩感到骄傲,并且应该对未来抱以期望。

d120c0e91923c093c20935bde1fc43f1.png

对于“写一封电子邮件”这样的任务,StableLM也是可以轻松应对。

在创作方面,若是给出这样的一个题目——“在深度神经网络和符号人工智能之间写一首史诗般的说唱战歌”

StableLM也是可以秒写一首rap的歌词:

23e103dd5efa42a9d5da3cdafa45c3eb.jpeg

在写代码方面,Stability AI也展示了“不走寻常路”的例子——

用C语言编写可以计算机生命意义的代码。

d029f700c587b459845d299a3e84d8a1.jpeg

文本对话、创作内容、编写代码,从官方亮出的例子上来看,似乎StableLM的能力还是可以的。

但为什么会出现刚才有人评价的“非常糟糕”呢?

货比三家,实力便可一较高下。

“跟ChatGPT不具可比性”

在实测的过程中,网友给StableLM出了这样的一个题目:

以下是关于一则新闻的信息:

标题为“FBI引用‘新证据’宣布追捕Shakur谋杀案嫌疑人”;副标题为“十年后,当局公布了杀害说唱歌手的凶手的姓名和照片”。

请完成这个故事的撰写。

31df080a20f76ff6d88fadf1ea9a45fd.png

虽然StableLM给出了一篇完整的新闻报道,但若是细看内容,却是经不住推敲的。

最直接的错误,就是StableLM竟然连被害人Tupac Shakur都不认得,而且还把Shakur视为凶手的西班牙名字……

如果类似的问题交给ChatGPT,那么结果就截然不同了:

cd705a277548f8a6cdb33cf6b6e73c9f.png

起码人家ChatGPT能认得事件主人公是谁。

当被问及非常简单的问题,例如“StableLM能做什么”,它给出的回答是:

主要用作系统工程和体系结构中的决策支持系统,也可以用于统计学习、强化学习等领域。

网友对此作答的评价是“平平无奇”

但更重要的是,在测试过程中,网友还发现StableLM缺乏对敏感内容的保护。

例如在著名的一项测试——“不要赞美希特勒(don’t praise Hitler)”中,它的表现就会令人大跌眼镜……

朋友们可以细品一下:

32b9d47d7f5e7fbb2bfb76b467be36df.png

依旧是同样的问题,若是交给ChatGPT,结果是这样的:

0225f76b36760d5380915db31c58d5a1.png

嗯,直接拒了。

不过网友也比较客气地提醒道:

先别急着说StableLM是史上最糟糕的语言模型。

毕竟人家Alpha版本的参数量目前较小,以及还是开源的。

如何试玩?

正如我们刚才提到的,目前StableLM在GitHub上已经开源。

但不仅如此,官方也在HuggingFace中上线了demo试玩!

840ef15df79bc5e6ce4c0c7fcd141edb.png

“入口”都放下面了,感兴趣的小伙伴们可以去体验一下喽~

HuggingFace地址:
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

GitHub地址:
https://github.com/Stability-AI/StableLM

参考链接:
[1]https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models
[2]https://twitter.com/StabilityAI/status/1648706156330876928
[3]https://mashable.com/article/stablelm-stability-ai-language-model-explained

点击进入—>【计算机视觉】微信技术交流群

最新CVPR 2023论文和代码下载

 
 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

多模态和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-多模态或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如多模态或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!

▲扫码进星球
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看36deb33f64cbf6cdf57b572a5162f939.gif

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了! 的相关文章

随机推荐

  • 可以同情弱者,别同情弱势!

    大家好 我是北妈 0 最近北妈在重刷 天道 里面提到了一个强势文化 弱势文化的概念 我觉得对生活和职场 感情都有些指导作用 我看影评和各种文章讨论这个的概念比较多 毕竟大家都喜欢谈格局 强弱 今天讨论下如何成为强者 强者是不是应该鄙视弱者
  • C++类与对象:初始化列表(赋值和初始化的区别)

    标题 使用初始化列表的情况 初始化与赋值的区别 构造函数体内部是赋值 初始化列表 const成员变量初始化 自定义类型成员初始化 成员变量的缺省值 临时变量 总结 使用初始化列表的情况 成员变量是const类型 成员变量是引用类型 成员变量
  • 求出最大连续子序列和 暴力算法、分治法、动态规划、贪心算法实现;Leecode 51.最大子序和

    求出最大连续子序列和 问题描述 给定一个整数数组 a 找到一个具有最大和的连续子数组 子数组最少包含一个元素 返回其最大和 这个问题也可转入Leecode 51 最大子序和 来源 力扣 LeetCode 示例 输入 2 1 3 4 1 2
  • MAC /usr/bin/目录下 Operation not permitted的解决

    mac系统下的Rootless机制 让我们在root权限下也不能随心所欲的读写所有路径了 特殊情况下我们需要关闭Rootless时 可尝试如下操作 1 重启按住 Command R 进入恢复模式 打开Terminal 2 键入命令 csru
  • 【性能测试】Jenkins+Ant+Jmeter自动化框架的搭建思路

    前言 前面讲了Jmeter在性能测试中的应用及扩展 随着测试的深入 我们发现在性能测试中也会遇到不少的重复工作 比如某新兴业务处于上升阶段 需要在每个版本中 对某些新增接口进行性能测试 有时还需要在一天中的不同时段分别进行性能测试 如果一味
  • Gradle Core Plugins (plugin is not in 'org.gradle' namespace)

    记录一个由 gradle 构建项目遇到的问题 起因 项目原先运行正常 不过个人 移除掉默认仓库 gradle 仓库后 重新拉取报错如下 FAILURE Build failed with an exception Where Build f
  • 框架(Framework)中常用设计模式分析

    文章目录 简介 概述 模式分类 创建型模式设计与分析 简单工厂模式 工厂方法模式 Factory Method 抽象工厂 Abstract Factory 结构型模式设计及分析 适配器模式 Adapter 装饰模式 Decorator 代理
  • opencv学习(十五)之图像傅里叶变换dft

    在学习信号与系统或通信原理等课程里面可能对傅里叶变换有了一定的了解 我们知道傅里叶变换是把一个信号从时域变换到其对应的频域进行分析 如果有小伙伴还对傅里叶变换处于很迷糊的状态 请戳这里 非常通俗易懂 而在图像处理中也有傅里叶分析的概念 我这
  • chromecast投屏_谷歌Chromecast与安卓Miracast投屏技术

    Win10的无线连接显示器用的就是Miracast 安卓Miracast投屏技术 Miracast是WiFi联盟推出来的标准 但这个标准似乎并没有对兼容性作详细的要求 于是 很多电视厂商都基于Miracast 魔改出了自家的投屏技术 例如现
  • 几个排序理解

    快速排序 快速排序是对冒泡排序的一种改进 通过一趟排序将要排序的数据分割成独立的两部分 其中一部分的所有数据都比另一部分所有的数据都要小 然后再按此方法对这两部分数据分别进行快速排序 整个排序过程可以递归进行 以此达到整个数据变成有序序列
  • 提取json字符串中指定格式中的参数值

    直接上代码 import java util ArrayList import java util regex Matcher import java util regex Pattern public class TestDemo pub
  • Linux ./configure --prefix命令

    源码的安装一般由3个步骤组成 配置 configure 编译 make 安装 make install 具体的安装方法一般作者都会给出文档 这里主要讨论配置 configure Configure是一个可执行脚本 它有很多选项 使用命令 c
  • 局域网访问本地localhost-VS2015调试WebService

    两点步骤 一 配置IP 二 VS管理员启动 配置ip 可以自定义IP 或者用自动分配的IP cmd ipconfig VS运行右键 显示所有应用程序 打开配置文件 在
  • 【css学习】使用css3中的var实现主题切换

    一 首先搭建基础的页面结构
  • Spring cloud项目扩展(二)项目集成redis和辅助工具hutool

    最近看到了一个很好用的集成开发工具 里面有很多工具类 可以提高开发效率 官方文档请看 https hutool cn docs 下面主要介绍一下在我们项目中加入工具并且通过这个工具使用redis 话不多说 直接开始 1 在我们原有的项目的项
  • 2021-05-05

    实训3 信息加密与哈希函数 实验目的 理解加密系统的概念 掌握经典加密的主要方法 理解混淆与扩散的概念 掌握DES加密的主要方法 了解非对称加密的重要意义 掌握RSA加密算法的主要思想与使用方法 理解数字签名的作用及生成方法 实验准备及注意
  • java声明方法抛出的异常

    java声明方法抛出的异常 TestExceptions java import java io 异常 public class TestExceptions public static void main String args void
  • 贵阳人文科技学院新颖的计算机毕业设计题目大全50例

    最近要准备毕业设计了 不会选题 希望可以帮忙给一些毕业设计题目 我整整花了一周把之前做的答辩通过的毕业设计成品进行整理如下列表 计算机科学技术毕业设计题目推荐1 10题 1 Springboot美食网站92nn7 2 Springboot基
  • Adb connection Error:远程主机强迫关闭了一个现有的连接

    小编遇到这个烦人的问题 总是一直报错 浏览了许多网页 总结了以下几种解决方法 这些都是转载加上自己的见解 这里本人是用最后一种搞定的 不过有时候需要进入paltform tools目录下 因为没有PATH路径 注意这种方法需要启动虚拟记得就
  • Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!

    点击下方卡片 关注 CVer 公众号 AI CV重磅干货 第一时间送达 点击进入 gt 计算机视觉 微信技术交流群 金磊 发自 凹非寺转载自 量子位 QbitAI 万万没想到 以文生图著名的Stable Diffusion 也入局了大语言模