ChatGPT之后,值得关注的垂直领域大模型

2023-11-16

垂直领域大模型是指在特定的领域或行业中经过训练和优化的大型语言模型。与通用语言模型相比,垂直领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。

ef985f4062b18d80ae4e5de26384423a.jpeg

题图 from unsplash

与通用大模型相比,垂直领域大模型具有以下优势和劣势:

优势:

  1. 领域专业性:垂直领域大模型经过专门的训练,能够更好地理解和处理特定领域的知识、术语和上下文。

  2. 高质量输出:由于在特定领域中进行了优化,垂直领域大模型在该领域的输出质量通常比通用大模型更高。

  3. 特定任务效果更好:对于特定领域的任务,垂直领域大模型通常比通用大模型表现更好。

劣势:

  1. 数据需求和训练成本:垂直领域大模型需要大量的特定领域数据进行训练,这可能会面临数据收集和标注的挑战。

  2. 适应性限制:垂直领域大模型在特定领域中的适应性较强,但在其他领域的表现可能相对较弱。

  3. 更新和维护成本:由于特定领域的知识和要求经常变化,垂直领域大模型需要定期更新和维护,以保持与最新发展的同步。

下面介绍几个知名度较高的垂直领域大模型,涉及教育、金融、医学、法律四个领域。

MathGPT 教育大模型

学而思正在进行自研数学大模型的研发,命名为MathGPT。面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。据透露,MathGPT将先从中小学数学做起,逐步覆盖全年龄学段和解题种类。

目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

BloombergGPT 金融大模型

近期根据彭博社报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型—BloombergGPT。

BloombergGPT 和 GPT模式一样,也是基于 Transformer架构的,采用的是译码器的技术路线。通过比较, BloombergGPT模型参数为500亿,在GPT-2 (1.5亿)和GPT-3 (1750亿)之间。Bloomberg构建了目前规模最大的金融数据集 FINPILE,通过对通用文本+金融知识的混合训练,使得 BloombergGPT在执行金融任务方面的表现超过了现有的通用 LLM模型,而在通用场景方面的表现则与现有的通用 LLM模型基本持平。

BenTsao 中文医学模型

https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

本草原名华驼(HuaTuo),是一个基于中文医学知识的LLaMA-7B微调模型。通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,并在此基础上对LLaMA进行了指令微调,提高了LLaMA在医疗领域的问答效果。

尝试利用GPT3.5 API将医学文献中的【结论】作为外部信息融入多轮对话中,在此基础上对LLaMA进行了指令微调。目前,团队只开放针对"肝癌"单个疾病训练的模型参数。在未来,我们计划发布融入文献结论的医学对话数据集,并且会针对“肝胆胰”相关16种疾病训练模型。

LaWGPT 中文法律知识模型

https://github.com/pengxiao-song/LaWGPT/

LaWGPT 是一系列基于中文法律知识的开源大语言模型,该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。

不远的将来会有更多垂直领域的大模型面世,百模大战已经拉开序幕,AI渗透到千行百业只是时间问题,我们一起见证机器崛起吧。


扩展阅读:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT之后,值得关注的垂直领域大模型 的相关文章

随机推荐

  • 高校巡讲总结—侯伯薇讲师

    这个月里面 借助CSDN的平台 在三所高校中做了 程序员修炼之路 的巡讲 在其中讲述了自己的一些经历 并和同学们聊了学习 思考和分享这三个要素 三所高校各自有各自的特点 感觉很有意思 一一叙述如下 首先 第一站是在辽宁工程技术大学 位于葫芦
  • 总结Windows下安装WSL与升级WSL2的方法

    目录 1 安装WSL1的方法 2 安装WSL2的方法 3 升级WSL1到WSL2的方法 1 打开win10的设置 搜索windows功能 打开启用或者关闭Windows功能 2 勾选以下2个地方 并重启 3 下载WSL2升级包 并点击安装
  • JS原型

    原型的概念 实例对象中 proto 是原型 是一个属性也是一个对象 是给浏览器使用的 是不标准的 这个叫隐式原型 构造函数中的prototype是原型 是一个属性也是一个对象 是给程序员用的 是标准的 proto 原型是浏览器使用的 有些浏
  • JDBC-数据库连接字符串

    SQLSERVER Connection conn DriverManager getConnection jdbc sqlserver localhost 1433 sa Oracle Connection conn DriverMana
  • 什么是rem单位和em单位?它们有什么区别?

    聚沙成塔 每天进步一点点 专栏简介 rem 和 em 单位 rem 单位 Root Em em 单位 区别总结 写在最后 专栏简介 前端入门之旅 探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来到
  • vue使用echarts与echarts-gl实现3d地图与 3d柱状图

    目录 前言 一 下载echarts与echarts gl 二 vue引入与页面使用 1 引入 2 页面引入echarts gl 三 下载地图数据 四 使用地图 1 html初始化地图放入位置 2 data创建变量 3 创建地图 4 钩子函数
  • remote: Support for password authentication was removed on August 13, 2021

    1 github在2021年8月13日这天搞事情 如果这天你提交了github代码报错如下 remote Support for password authentication was removed on August 13 2021 P
  • 第3章 分布式文件系统HDFS

    3 1 分布式文件系统 3 1 1 计算机集群结构 3 1 2 分布式文件系统的结构 两类节点 1 主节点 Master Node 或称为 名称节点 NameNode 负责文件和目录的创建 删除和重命名等 同时管理着数据节点和文件块的映射关
  • python噪声

    1 skimage的API noise gs img util random noise img mode gaussian gaussian 高斯加性噪声 noise salt img util random noise img mode
  • 粒子群算法(PSO)优化RBF神经网络实践

    算法原理及流程 关于RBF神经网络的细节详见 RBF神经网络学习及实践 关于PSO算法的细节详见 粒子群优化算法 PSO python实践 PSO算法优化RBF神经网络训练流程图如下所示 代码实现 代码直接使用文章RBF神经网络学习及实践和
  • 23+ Useful HTML5 Open Source Online Video Players & Libraries,

    Akamai s Open Video Player for HTML5
  • blender基本操作

    文章目录 引言 一 选择 二 移动 1 xyz轴移动 2 xyz平面移动 3 精确移动 4 快捷键移动G 三 旋转 四 缩放 五 变换 1 变换坐标系 2 变换轴心 六 吸附 七 模式切换 八 物体的合并和分离 1 合并 2 分离 九 设置
  • 51单片机一个按键,通过单击,双击,三击,长按实现四种不同的led特效并且每次切换模式伴随不同的音效。(连击4下为无效指令)

    一个定时器负责扫描按键按下的时间长短 一个定时器负责实现具体的led特效功能 主函数循环扫描按键 避免了占用cpu资源过多 导致程序堵塞 无法扫描到按键等问题 还可以通过定时器来扫描按键按下 时长等 想要实现的程序放在主函数中执行 新人第一
  • [Matlab有限元分析] 1.有限元分析的发展、基本概念和特点

    英国有限元方法专家Zienkiewicz的书籍 有限元方法 在开头关于有限元方法的概述说的特别好 摘录如下 由于人类思维的局限 使得人们无法将复杂的宇宙万物只用简单的表达来概括 因此 人们会将复杂的系统分解成为一个个部件或者单元 而这些部件
  • cmake关键字file理解

    1 file WRITE filename message to write WRITE选项将会写一条消息到名为filename的文件中 如果文件已经存在 该命令会覆盖已有的文件 如果文件不存在 它将创建该文件 2 file APPEND
  • 解决Windows下安装PostgreSQL :“unable to write inside temp environment variable path”的错误

    Windows下安装PostgreSQL 启动安装程序的时候报错 unable to write inside temp environment variable path 解决方法 1 开始菜单 打开运行 2 输入regedit 打开注册
  • SQL Sever——远程过程调用失败(0x800706be)

    最近重装了系统 VS和SQL Sever莫名奇妙的不能用了 下面总结一下这个过程中遇到的问题 跟大家分享一下经验 大概是以前的安装过程都十分顺利 这次 在尝试了数次登陆不上去之后 我仍然怀疑是自己眼花了 怎么办 查吧 一开始我想到的 肯定是
  • Vmware安装虚拟机出现attempting to start up from?一文帮你解决

    有很多小伙伴在安装windows是会出现一个attempting to start up from提示 然后就会进入一个蓝色的页面 也就是下边这两张图 这时候会让你选择在这时候有很多小伙伴就懵了 我应该怎么选择 不要方 下边我来教你解决 下
  • 两数相加(java)

    给你两个 非空 的链表 表示两个非负的整数 它们每位数字都是按照 逆序 的方式存储的 并且每个节点只能存储 一位 数字 请你将两个数相加 并以相同形式返回一个表示和的链表 你可以假设除了数字 0 之外 这两个数都不会以 0 开头 例 输入
  • ChatGPT之后,值得关注的垂直领域大模型

    垂直领域大模型是指在特定的领域或行业中经过训练和优化的大型语言模型 与通用语言模型相比 垂直领域大模型更专注于某个特定领域的知识和技能 具备更高的领域专业性和实用性 题图 from unsplash 与通用大模型相比 垂直领域大模型具有以下