百川AI大模型开放内测,你的AI工具箱里又多了一个选择

2023-11-17

日前国内大模型开源市场又多了一个猛将:百川智能,厂商卷,消费者就受益,这块模型由原搜狗创始人带队研发,背后融合有一些搜索的思路,日前公开了其53B的大模型,未来的企业应用上又多了一份选择。

https://www.baichuan-ai.com/ 官方网站

305bf8c4f99eefea17e44450fd68775e.png

申请内测

内测申请比较简单,手机号登陆网站后,点击“加入内测”按钮,就加入了等待列表,审核速度还是比较快的。2102bc0dca8fdc27ea83a0d07474c247.pngb4f912563ab7efdb973790132cf9d0ba.png审核通过后,会有短信通知,就可以正常使用对话交流了。ebe096b4482652dd15f055a2d6f05348.png

小尺寸开源模型

百川旗下的 Baichuan-7B 与 Baichuan-13B 两个模型目前已经开源可商用,为企业内部应用提供了两个不错的选择。7d05187d587adc46f66bf6c7116d74df.pngBaichuan-7B 是一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。在标准的中文和英文 benchmark(C-Eval/MMLU)上均取得同尺寸最好的效果。

0977cb3c0be6a22eb6d0f413045c4d76.png

Baichuan-13B 是包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。Baichuan-13B 有如下几个特点:

  • 更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿,并且在高质量的语料上训练了 1.4 万亿 tokens,超过 LLaMA-13B 40%,是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为 4096。

  • 同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型(Baichuan-13B-Chat),具有很强的对话能力,开箱即用,几行代码即可简单的部署。

  • 更高效的推理:为了支持更广大用户的使用,我们本次同时开源了 int8 和 int4 的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如 Nvidia 3090 这样的消费级显卡上。

  • 开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。

26e8f9d44a54c96d20dafcaa33947b03.png

对话体验

对话界面与主流基本一致,可以拿一些想法与百川模型进行交流,看看实际效果。c8e072ccf8515622a1890a472d1466dd.png4d3436ed433f9b422454c5194ecfcecd.png33d25605617b2b37433d9b2c95cffcc4.png


随着时间的推移,会有更多的国产模型开放能力出来,功能也会越来越强大,但目前普遍离GPT-3.5都还有些距离,厂商们加油吧。

公众号回复“Claude实战”,“ChatGPT实战”,“WPSAI实战”,获取相应的电子书。

—扩 展 阅 读—

WPS Office AI实战总结,智能化办公时代已来

你对 ChatGPT 的所有疑问,看这这一篇文章就够

走访数十位企业中高层后,这些事你必须得明白

正在发生或即将发生的AI大模型应用

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

百川AI大模型开放内测,你的AI工具箱里又多了一个选择 的相关文章

随机推荐

  • 李承鹏小说

    1 李可乐抗拆记 城镇化进程 拆迁是个大事情 房子是普通老百姓生活中最重要的东西 一个被拆迁的社区就是一个矛盾激化的社会 有人想终于可捞一笔了 一辈子也就这么一次暴富的机会 有人喜欢老地方 不在乎钱 就不要搬 大部分都是乐意搬 只要补偿合理
  • SprongBoot集成MinIo

    SprongBoot集成MinIo 1 集成MinIo 1 1 添加依赖
  • 第八篇 VGGNet——网络实战

    文章目录 摘要 1 项目结构 2 划分训练集和测试集 3 计算mean和Standard 3 1 标准化的作用 3 2 归一化的作用 4 训练 4 1 导入项目使用的库 4 2 设置随机因子
  • 利用ANSYS随机振动分析功能实现随机疲劳分析

    ANSYS随机振动分析功能可以获得结构随机振动响应过程的各种统计参数 如 均值 均方根和平均频率等 根据各种随机疲劳寿命预测理论就可以成功地预测结构的随机疲劳寿命 本文介绍了ANSYS随机振动分析功能 以及利用该功能 按照Steinberg
  • Android SDK Android NDK 官方下载地址

    Android SDK Android NDK 官方下载地址 Android NDK r6b Windows http dl google com android ndk android ndk r6b windows zip Mac OS
  • VisualStudio(2022)- 打包项目文件为.exe安装包

    目录 前言 一 安装扩展 二 制作安装包 setup文件 2 1 添加setup项目 2 2 配置setup项目 2 3 添加项目文件到setup项目中 扩展知识 三个文件夹说明 2 4 设置项目主输出 2 5 设置快捷方式 2 6 生成安
  • 数据结构--单链表的c语言实现(超详细注释/实验报告)

    数据结构 单链表的c语言实现 超详细注释 实验报告 知识小回顾 在顺序表中 用一组地址连续的存储单元来一次存放线性表的结点 因此结点的逻辑顺序和物理顺序是一致的 而链表则不然 链表是用一组任意的存储单元来存放线性表的结点 这组储存单元可以是
  • 面向对象之魔法方法

    目录 概念 魔法方法分类 构造与初始化 new new 的使用场景 init del 类的表示 str repr bool 访问控制 比较操作 eq ne lt gt 容器类操作 重要 可调用对象 序列化 getstate setstate
  • linux initcall机制

    Linux系统启动过程很复杂 因为它既需要支持模块静态加载机制也要支持动态加载机制 模块动态加载机制给系统提供了极大的灵活性 驱动程序既可支持静态编译进内核 也可以支持动态加载机制 Linux系统中对设备和子系统的初始化在最后进行 主要过程
  • 网关、路由、DNS详细解释

    网关 Gateway 又称网间连接器 协议转换器 网关在网络层以上实现网络互连 是最复杂的网络互连设备 仅用于两个高层协议不同的网络互连 网关既可以用于广域网互连 也可以用于局域网互连 针对普通客户来说 网关就是运营商的交换机端口地址 也就
  • AI 代码辅助工具-codeium(免费)---Android studio

    Codeium官网说明 JetBrains IDEs Tutorial Codeium Free AI Code Completion ChatCodeium offers best in class AI code completion
  • Linux 系统中的 SNMP Trap及常用OID

    浅谈 Linux 系统中的 SNMP Trap 转载 http www ibm com developerworks cn linux l cn snmp 本文讲解 SNMP Trap 在介绍 Trap 概念之前 首先认识一下 SNMP 吧
  • Windows 查看端口占用并关闭

    Windows 查看端口占用并关闭 在启动服务的时候 可能会遇到端口被占用的情况 这时就要知道哪个服务占用了这个端口 并将其关闭 然后再启动服务就不会存在端口占用了 这里以 Tomcat 的默认端口 7080 为例 一 打开命令窗口 Win
  • 概率图模型笔记(9-10)——Inference-Belief Propagation

    9 Inference Belief Propagation part1 9 1 Belief Propagation 9 1 1 聚类图 Cluster Graphs 聚类图即这样的一个无向图 节点是团 Ci X1 Xn C i sube
  • element-plus 组件解析 - Collapse 折叠面板

    element plus 组件解析 Collapse 折叠面板 1 组件介绍 2 组件组成 3 组件实现 3 1 el collapse 1 v model activeNames 2 手风琴效果 3 el collapse 关键逻辑 3
  • Vue 源码之Vue 响应式原理【完整版】

    写在前面 由于昨天写的文章 Vue 源码之Vue视图更新原理 一 与今天的内容代码有些相关联 所以开头先进行简单的回顾阐述 也方便对内容进行完整的阅读 Vue 视图更新原理 Vue 的视图更新原理主要涉及的是响应式相关API Object
  • 深入理解PHP内存管理之谁动了我的内存

    作者 Laruence 本文地址 http www laruence com 2011 03 04 1894 html 转载请注明出处 首先让我们看一个问题 如下代码的输出 var dump memory get usage a larue
  • Ubuntu18.04——正确安装英伟达(NVIDIA)显卡驱动的一种简便方法

    Ubuntu18 04 正确安装英伟达 NVIDIA 显卡驱动的一种简便方法 前提说明 1 打开软件和更新 附加驱动 选中下图所示项并点击应用更改 已经是的话 就不用更改 2 连上网络 打开终端 依次输入以下命令 3 退出终端 重新启动电脑
  • php后台接收blob文件流,如何从php中的BLOB播放流音频?

    我有这个smartReadFile php函数 它允许从文件播放音频流 你将如何修改此函数 以便查询mysql数据库BLOB而不是读取特定文件 function smartReadFile location filename mimeTyp
  • 百川AI大模型开放内测,你的AI工具箱里又多了一个选择

    日前国内大模型开源市场又多了一个猛将 百川智能 厂商卷 消费者就受益 这块模型由原搜狗创始人带队研发 背后融合有一些搜索的思路 日前公开了其53B的大模型 未来的企业应用上又多了一份选择 https www baichuan ai com