Fine-tuning Large Enterprise Language Models via Ontological Reasoning

2023-11-05

本文是LLM系列文章，针对《Fine-tuning Large Enterprise Language Models via Ontological Reasoning》的翻译。

基于本体论推理的大型企业语言模型微调

摘要
1 引言
2 微调LLM的神经符号管道
3 通过概念证明进行初步验证
4 结论

摘要

大型语言模型（LLM）利用特定任务的训练数据，将微调作为一种适应不同目标的技术。任务特异性应该与领域定向齐头并进，即LLM的专业化，以准确地处理给定感兴趣领域的任务。然而，模型通常是根据公开可用的数据进行微调的，或者最多是根据数据库中的真实数据进行微调，而忽略了业务级别的定义和领域经验。另一方面，企业知识图谱（EKG）能够通过本体论推理来捕获和增强这些领域知识。为了将LLM的灵活性与EKG的领域定向相结合，我们提出了一种新的神经符号体系结构，该体系结构利用本体论推理的力量来构建用于LLM微调的任务和领域特定语料库。

1 引言

2 微调LLM的神经符号管道

3 通过概念证明进行初步验证

4 结论

根据计算语言学协会欧洲分会最近发表的一项工作，预先训练的语言模型还不能进行演绎推理：它们仍然不能概括逻辑规则，即使提供了规则，LLM也倾向于忘记以前推断的事实。虽然Transformer架构和推理方法之间还没有进行广泛的比较，但我们的工作表明，通过产生微调语料库作为本体论推理的副产品，可以明显提高领域特定NLP任务的LLM性能。我们利用我们在演绎推理方面的经验，为在企业知识图谱上进行推理的神经符号平台迈出了第一步。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

知识图谱

LLM

语言模型

人工智能

自然语言处理

Fine-tuning Large Enterprise Language Models via Ontological Reasoning 的相关文章

文档扫描与矫正-仿射变换

图像变换是计算机视觉和图像处理中的关键技术之一它允许我们对图像进行各种形式的变形调整和校正其中仿射变换是一种常见的变换方式在文档扫描过程中由于拍摄角度和畸变等原因文档图像可能存在一定程度的形变仿射变换可以用于校正文档图像使
使用 Neo4j 和 LangChain 集成非结构化知识图增强 QA

目前基于大模型的信息检索有两种方法一种是基于微调的方法一种是基于 RAG 的方法信息检索和知识提取是一个不断发展的领域随着大型语言模型 LLM 和知识图的出现这一领域发生了显着的变化特别是在多跳问答的背景下接下来我们继续深入
2024年华数杯国际赛B题：光伏发电功率思路模型代码解析

2024年华数杯国际赛B题光伏发电功率 Photovoltaic Power 一问题描述中国的电力构成包括传统能源发电如煤油和天然气可再生能源发电如水电风能太阳能和核能以及其他形式的电力这些发电模式在满足中国对电力的巨
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
用通俗易懂的方式讲解：如何用大语言模型构建一个知识问答系统

传统搜索系统基于关键字匹配在面向游戏攻略技术图谱知识库等业务场景时缺少对用户问题理解和答案二次处理能力本文探索使用大语言模型 Large Language Model LLM 通过其对自然语言理解和生成的能力揣摩用户意图并对
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
问CHAT很繁琐的问题会不会有答案呢？

问CHAT 什么已有的基于极值理论的极端温度重现期主要针对极端高温事件对极端低温事件研究较少 CHAT 回复为这主要可能是由于以下几个原因 1 气候变化与全球变暖当前全球变暖和气候变化的问题备受关注这导致科研者更加关注极端高温事件
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

计算方法（三）矩阵分解1-正交分解(QR分解)

为什么80 的码农都做不了架构师 gt gt gt 正交分解矩阵的正交分解又称为QR分解是将矩阵分解为一个正交矩阵Q和一个上三角矩阵的乘积的形式任意实数方阵A 都能被分解为这里的Q为正交单位阵即 R是一个上三角矩阵这种分解被称为
手写Mybatis：第20章-Mybatis 框架源码10种设计模式分析

文章目录一类型创建型模式 1 1 工厂模式 1 2 单例模式 1 3 建造者模式二类型结构型模式 2 1 适配器模式 2 2 代理模式 2 3 组合模式 2 4 装饰器模式三类型行为型模式 3 1 模板模式 3 2 策略模
Unity接入TopOn聚合广告平台SDK【聚合了穿山甲，优量汇(腾讯广告)，快手，Mintegral，sigmob等各大广告平台SDK】

TopOn聚合穿山甲优量汇快手 Mintegral各大广告SDK教程接了好几家SDK 都有亿点点蛋疼直到遇到了TopOn TopOn的文档和SDK相当齐全包括Android IOS Unity Cocos2dx CocosCrea
数据库动态加载省市区信息，实现三级联动

本文转载自 http my oschina net zhengweishan blog 402483 摘要动态的从数据库加载全国省市区后台使用的是SpringMvc 前台使用的是bootstrap页面展示 demo源码下载地址 http
Qt安装包+安装配置说明（强烈推荐，小白专用）

链接 https pan baidu com s 1zrhLUP sjWgCQdrFacDQCQ 提取码 uie5内附赠详细安装说明可以信我获取
es7合并数组相关报错Uncaught (in promise) TypeError: Invalid attempt to spread non-iterable instance...

方法一 let o1 a 1 b 2 c 3 let o2 o1 d 4 o2 a 1 b 2 c 3 d 4 let arr1 0 1 2 let arr2 arr1 3 arr2 0 1 2 3 方法二 let o1 a 1 b 2 c
科普:java与C++的区别

Java与C 是两种广泛使用的编程语言它们在某些方面存在不同之处本文将详细介绍Java与C 的区别一 C 与Java的历史 C 语言是由Bjarne Stroustrup在20世纪80年代初期开发的一种面向对象编程语言它是C语言的扩
服务器CPU占用率高，如何排查？

1 定位进程登录服务器执行top命令查看CPU占用情况 top 2 定位线程如果进程23456占用率高 top Hp23456 进行定位线程 3 定位代码通过top命令我们目前已经定位到导致CPU使用率较高的具体线程比如线程4
电脑如何进入bios模式_电脑BIOS是什么？到底有什么用？如何进入电脑BIOS

BIOS是英文 Basic Input Output System 的缩略语直译过来后中文名称就是基本输入输出系统其实它是一组固化到计算机内主板上一个ROM芯片上的程序它保存着计算机最重要的基本输入输出的程序系统设置信息开机后
Python3 + Pymysql + mysql 连接方法

准备材料 1 host地址 127 0 0 1 2 端口号 3306 3 用户名 root 4 密码 5 数据库名 information persons 6 python3 的pymysql库正式开始查询 1 首先导入pymysql包
C99和C89

这是c0conut同学的一份作业也可以理解为总结为了保留这份作业写了博客我尽量使自己写得简单好懂有趣 C99与C89的亲子关系就如DOM结构一般 C99与C89之间也充满温情老父亲C89顾名思义出生于89年也被称为ANSI C
validator 重写方法报错

javax validation ConstraintDeclarationException HV000151 A method overriding another method must not redefine the parame
windows常用命令大全

作者介绍作者小刘在C站每天分享课堂笔记一起努力共赴美好人生夕阳下是最美的绽放目录运行框命令 cmd中 Windows运行中快捷键运行框命令 shutdown s t 后家秒数计划关机任务 migwiz Window
x-oss-process_OSS中的同理心-重要

x oss process 我不花很多时间在开放源码项目的整个工作日和许多晚上上我对OSS的使用形成了一种或两种意见特别是在为项目做贡献时作为一个使用Github之类的工具的社区我们已经走了很长一段路这使得在野外发布OSS项目
什么是区块链？

什么是区块链今天给大家讲解我们区块链的第一课我们要学习区块链首先我们必须得了解什么是区块链只有理解了区块链的概念我们才能入门区块链接下来我会从浅入深的带着大家去理解区块链的含义首先我们从字面上来理解区块链包含着两层含义
kvm虚拟化技术

前言 kvm是一种虚拟化技术使用概念 kvm是linux内核的模块它需要CPU支持采用硬件辅助虚拟化技术Intel VT AMD V 内存的相关技术如Intel的EPT和AMD的RVI 是底层虚拟化内核模块检查cpu是否支持虚拟化
大学c语言程序设计题库选择题,黑龙江大学C语言程序设计试题库程序单选.doc

单选题 46 若输入ab 程序运行结果为 main static char a 2 scanf s a printf c c a 1 a 2 C A a b B a C b D 程序出错 47 若有说明 int a 3 4 0 则下面正确的
Hadoop HA集群两个NameNode都是standby或者主NameNode是standby，从NameNode是active的情况集锦

文章目录背景架构 HDFS HA配置错误原因解决方案方案一方案二方案三首先查看自己各参数文件是否配置出错后记补充 failover transitionToActive 常用端口号及配置文件常用端口号 hadoop3
服务器上传图片不显示,网站后台上传图片失败或不显示的原因

这四年多以来比尔云做过近百个网站发现好多网站后台上传图片都会出现一些错误也不管这个程序是ASP的还是PHP的对于为什么网站后台上传图片失败今天比尔云结合自己的经验给大家总结一下大家以后在搞网站时遇到相应的问题就好解决了第一件事
Fine-tuning Large Enterprise Language Models via Ontological Reasoning

本文是LLM系列文章针对 Fine tuning Large Enterprise Language Models via Ontological Reasoning 的翻译基于本体论推理的大型企业语言模型微调摘要 1 引言 2 微调

热门标签