chatglm2外挂知识库问答的简单实现

2023-11-18

一、背景

大语言模型应用未来一定是开发热点，现在一个比较成功的应用是外挂知识库。相比chatgpt这个知识库比较庞大，效果比较好的接口。外挂知识库+大模型的方式可以在不损失太多效果的条件下获得数据安全。

二、原理

现在比较流行的一个方案是langchain+chatglm，这已经算是一个成品了，也可以考虑自己上手捏一下泥巴，langchain学习成本有点高，可以直接利用prompt来完成问问题会简单很多。具体方案我参考了这个文章：大模型外挂(向量)知识库 - 知乎 (zhihu.com) 基本的思路简化成这张图

大模型外挂(向量)知识库

简单的说就是根据用户问题，从知识库获取与“问题”相关的“文档片段”，让大模型根据文档片段来回答“问题”。其实这种根据指定内容回答问题的模型也是挺成熟的，至少huggingface上就有很多，只不过那些模型是根据BERT模型+QA数据集微调好的。我们相信chatglm这类大模型理解问题和总结内容的能力一定更强。

这里就涉及到一个如何获取“问题”相关的“文档片段”的过程了，其实可以直接用文本检索方式，但传统的全文检索由于是词的匹配，因此对纯粹的问句效果可能不好。因此现在主流的方式是用向量匹配，就是把“问题”和知识库的文本都转成向量，再用向量的近似搜索获取更为相关的结果。

应用这种方式会很容易想到一个问题，也是上面知乎文章中提到的对称语义检索。即一定会把与“问题”接近的语句作为第一返回，它只是文字表述和问题一样，但并不是问题的答案。例如

也许这不是个问题，因为谁会在知识库里留下大量问句呢？或者你可以通过预处理把问题和大量正文绑定起来就不会匹配出“问题”了。所以使用向量的效果到底比纯粹的全文检索是否更好我也不清楚，毕竟检索效果还和预处理时候文本片段的切割、向量转换、向量最近邻查询效果有关系。

三、实现

这里我直接使用了text2vec + chromadb简单实现。text2vec负责对文本转为向量， chromadb负责进行向量检索。

text2vec地址在shibing624/text2vec-base-chinese · Hugging Face ,预训练模型不算大

chromadb是一个新出的向量数据库，很多功能不完善，只是为了快速地体验一下向量存储检索功能，本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGLM

大语言模型

大模型应用开发

文本向量化

chatglm2外挂知识库问答的简单实现的相关文章

本地搭建属于自己的ChatGPT：基于PyTorch+ChatGLM-6b+Streamlit+QDrant+DuckDuckGo

本地部署chatglm及缓解时效性问题的思路 xff1a 模型使用chatglm 6b 4bit xff0c 推理使用hugging face xff0c 前端应用使用streamlit或者gradio 微调对显存要求较高 xff0c 还没
UC伯克利发布大语言模型排行榜！Vicuna夺冠，清华ChatGLM进前5

夕小瑶科技说分享来源新智元编辑好困万万没想到 xff0c 现在大语言模型们也要像王者荣耀 LoL Dota这些游戏里的玩家一样打排位赛了 xff01 据说 xff0c 那些闭源模型们很快也会被拉出来溜溜最近 xff0c 来自L
探索将大语言模型用作推荐系统

编者按目前大语言模型主要问答对话等场景进行被动回答是否可以将大模型应用于推荐系统进行主动推送呢这篇文章回顾了可以将大模型作为推荐系统的理论基础并重点描述了基于英文和阿拉伯语的购物数据集微调T5 large模型探索将LLMs用
LLM Data Pipelines: 解析大语言模型训练数据集处理的复杂流程

编者按在训练大语言模型的过程中构建高质量的训练数据集是非常关键的一步但关于构建大模型训练所需数据集的通用数据处理流程 Data pipelines 的相关资料极为稀少本文主要介绍了基于Common Crawl数据集的数据处理流程首
国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布100亿参数规模的开源可商用大语言模型CPM-Bee

5月27日 OpenBMB发布了一个最高有100亿参数规模的开源大语言模型CPM BEE OpenBMB是清华大学NLP实验室联合智源研究院成立的一个开源组织该模型针对高质量中文数据集做了训练优化支持中英文根据官方的测试结果其英文测
【AI实战】开源可商用的中英文大语言模型baichuan-7B，从零开始搭建

AI实战开源可商用的中英文大语言模型baichuan 7B 从零开始搭建 baichuan 7B 简介 baichuan 7B 中文评测 baichuan 7B 搭建参考 baichuan 7B 简介 baichuan 7B 是由百川智
Chatglm2-6b模型相关问题

Chatglm2 6b模型相关问题 1 Chatglm2 6b模型p tuning后推理答非所问 2 ChatGLM2 6b ptuning 3 ChatGLM2 6b部署 1 Chatglm2 6b模型p tuning后推理答非所问据C
【大模型】长度 32K 上下文的 ChatGLM2-6B-32K 来了，开源可商用

大模型长度 32K 上下文的 ChatGLM2 6B 32K 来了开源可商用简介 ChatGLM2 6B 32K ChatGLM2 6B 32K 新特性环境配置环境搭建安装依赖代码及模型权重拉取拉取 ChatGLM2 6B
收入最高的十大IT职位

过去的一年对科技行业来说非常艰难一些公司宣布裁员面临着迫在眉睫的经济衰退威胁尽管经历了坎坷的一年但市场对科技人才的需求仍然强劲截至1月美国的科技人才失业率下降到1 5 对于拥有适当技能和专业知识的技术人员来说市场对人才的需求仍
ChatGLM2-6B安装部署（详尽版）

1 环境部署合理的上网工具安装Anaconda3 安装GIT 安装GUDA 11 8 安装NVIDIA 图形化驱动 522 25版本如果电脑本身是更高版本则不用更新 1 1 检查CUDA 运行cmd或者Anaconda 运行以下命令
05 神经网络语言模型（独热编码+词向量的起源）

博客配套视频链接 https space bilibili com 383551518 spm id from 333 1007 0 0 b 站直接看配套 github 链接 https github com nickchen121 Pr
独步潮流！如何在私有数据集上塑造GPT式大型语言模型的独特风格！

导读 Fine tune 是一种能够以成本效益的方式调整预训练 LLM 的技巧本文主要比较了用于最新的开源 LLM Falcon 的不同参数高效微调方法并为大家介绍如何使用单个 GPU 并在一天内对开源的大语言模型 Falcon 进行微
【AI实战】开源大语言模型LLMs汇总

AI实战开源大语言模型LLM汇总大语言模型开源大语言模型 1 LLaMA 2 ChatGLM 6B 3 Alpaca 4 PandaLLM 5 GTP4ALL 6 DoctorGLM MedicalGPT zh v2 7 Medica
【AI实战】llama.cpp 量化部署 llama-33B

AI实战 llama cpp 量化部署 llama 33B llama cpp 量化介绍环境配置安装 llama cpp 拉取 llama cpp 仓库代码编译llama cpp 生成量化版本模型模型准备将上述 pth模型权重转换
大语言模型介绍(一)

什么是大语言模型由于ChatGPT的火爆把大语言模型这个新名词推到了大众的视野里那么什么是大语言模型什么是GPT WIKI百科对大语言模型是这样解释的大语言模型英语 large language model LLM 是一种语言模
03 什么是预训练（Transformer 前奏）

博客配套视频链接 https space bilibili com 383551518 spm id from 333 1007 0 0 b 站直接看配套 github 链接 https github com nickchen121 Pr
开源LLM「RWKV」想要打造AI领域的Linux和Android｜ChatAI

RWKV想逐步成为最强开源模型中期计划取代Transformer 能如愿吗我们没有护城河 OpenAI也是近期谷歌内部人士在Discord社区匿名共享了一份内部文件点破了谷歌和OpenAI正面临的来自开源社区的挑战尽管经外媒Se
基于大语言模型的垂直领域知识问答系统流程学习

什么是垂直领域大语言模型应用当前基于大模型的知识问答十分火热大模型虽然能回答大多数通用问题但在垂直领域中回答的深度准确度及时效性均有限因此为了解决这一问题可以结合本地知识结合大模型来解决垂直领域即在某个领域内专有的知识问
超详细！大模型面经指南（附答案）

大模型应该算是目前当之无愧的最有影响力的AI技术它正在革新各个行业包括自然语言处理机器翻译内容创作和客户服务等成为未来商业环境的重要组成部分截至目前大模型已超过100个大模型纵横的时代不仅大模型越来越卷就连大模型相关面试也
【理论+实战】带你全面了解 RAG，深入探讨其核心范式、关键技术及未来趋势

写在前面大家好关于RAG实战文章已经写了三篇了有兴趣可以自行去看一下用通俗易懂的方式讲解在 Langchain 中建立一个多模态的 RAG 管道用通俗易懂的方式讲解大模型 RAG 在 LangChain 中的应用实战用通俗易

随机推荐

USB转串口那些事儿—USB转串口工作原理及应用

一简介 USB转串口即实现计算机USB接口到物理串口之间的转换可以为没有串口的计算机或其他USB主机增加串口使用USB转串口设备等于将传统的串口设备变成了即插即用的USB设备 USB虚拟串口应用特点 USB应用广泛支持热插拔传输速
Postman接口测试——我看过最详细+全面的文章教程了【转载】

Postman简介一般简单的接口测试我们可以直接在浏览器里面进行调试但是涉及到一些权限设置的就无法操作了因此我们需要接口测试的相关工具 Postman 是一个接口测试和 http 请求的工具官网地址 https www getpos
Mac电脑花屏

原因 GPU 加速导致和电脑的独显有关解决办法打开谷歌浏览器点击上图的三个点选择设置在高级设置中选择系统关掉硬件加速模式
十大优秀编程项目，让你的简历金光闪闪

全文共3241字预计学习时长6分钟被问到如何学习编程时最常听到的问题就是有没有什么新项目的好点子一些老套的答案有做一个象棋游戏或者命令行界面这些答案没有错但这些例子不符合现代编程的需要现代软件编写需要经常使用软件服务化
【华为OD机试真题2023B卷 JAVA&JS】阿里巴巴找黄金宝箱(V)

华为OD2023 B卷机试题库全覆盖刷题指南点这里阿里巴巴找黄金宝箱 V 知识点数组哈希表滑窗时间限制 1s 空间限制 256MB 限定语言不限题目描述一贫如洗的樵夫阿里巴巴在去砍柴的路上无意中发现了强盗集团的藏宝地藏宝地
尤克里里整理

尤克里里如何按弦如何弹奏带数字的四线谱如何按弦如何弹奏带数字的四线谱数字代表品格数 1就是1品 2就是2品数字标记在几弦上面就按住几弦的几品
计算机毕设项目大数据个性化音乐推荐算法分析

文章目录 0 前言 1 研究目的 2 研究方法 2 1 传统推荐算法 2 2 基于LightGBM决策树模型的推荐算法 3 研究结论 0 前言基于大数据个性化音乐推荐算法分析提示适合用于课程设计或毕业设计工作量达标源码开放项目分
告别卡顿，教你正确清理手机APP缓存垃圾，释放空间

智能手机已经成为我们生活中不可或缺的重要工具让我们随时随地保持联系获取信息和娱乐但是使用过多的应用程序可能会导致手机变得缓慢并占用存储空间这些应用程序产生大量的缓存和垃圾文件如果不及时清理将会影响手机的性能和速度今天我们将
集团如何实现数字化转型？永洪BI助力由由集团

随着互联网的边界不断拓宽生活性服务业正驶入数字化转型快车道中国信息通信研究院发布的中国数字经济发展报告 2022 显示 2021年我国数字经济发展取得新突破数字经济规模达到45 5万亿元占 GDP 比重达到39 8 三大产业
Chrome中安装扩展的三种方式

chrome浏览器安装扩展有多种方式请看以下介绍 1 从chrome网上应用商店安装优雅法在google chrome中打开chrome网上应用商店 https chrome google com webstore 搜索需要的扩展在
详解list.toArray(new String[0])

List
使用树莓派(raspberry pi)搭建网站(nginx+php+mysql+ddclient)

标签树莓派 raspberrypi php 网站 mysql 分类 Linux技术最近在研究学习PHP 有时候想随时就学习所以就决定搭建一个网站随时可以进行学习因为要24小时在线要低功耗和安静所以选择了树莓派我们开始吧 ng
四元素与旋转矩阵

如何描述三维空间中刚体的旋转是个有趣的问题具体地说就是刚体上的任意一个点P x y z 围绕过原点的轴 i j k 旋转求旋转后的点P x y z 旋转矩阵旋转矩阵乘以点P的齐次坐标得到旋转后的点P 因此旋转矩阵可以描述旋转 x
数据治理-数据质量-数据质量管理方法和工具

常用质量管理工具目前在质量管理领域有一系列常用的数据质量管理工具主要分为传统的质量管理工具新的质量管理工具和其他质量管理工具传统的质量管理七大工具传统的七种工具包含分层法检查表帕累托图因果分析图直方图散布图控制图
2017最新整理深度学习神经网络算法全套

https pan baidu com s 1cHGAv0 from groupmessage adapt pc fr ftw list path 2F
基于node.js 实现百度ai人脸检测功能（api）

基于node js 实现百度ai人脸检测功能 api 很有幸和老师同学们一起尝试学习百度ai的相关技术文档自己做了一个很ez的人脸检测的小网页和大家分享一下百度ai技术文档百度ai人脸检测技术文档 1 首先根据技术文档中的要求我们要
Object SLAM: An Object SLAM Framework for Association, Mapping, and High-Level Tasks 论文解读

是一篇来自机器人顶刊T RO的文章发表于2023 5 An Object SLAM Framework for Association Mapping and High Level Tasks 论文 An Object SLAM Fram
问题十：关于application.loadlevel和SceneManager.LoadScene调用后新场景会变暗的问题

根据百度贴吧的帖子来到http answers unity3d com questions 919940 applicationloadlevel changes lighting for some rea html 这篇文章说他重新lo
Linux与Windows的常见差异

Linux与Windows的常见差异一在Linux上顺理成章换到Windows上就可能令人费解的事二一些Linux的使用技巧三一些Windows的使用技巧一在Linux上顺理成章换到Windows上就可能令人费解的事命
chatglm2外挂知识库问答的简单实现

一背景大语言模型应用未来一定是开发热点现在一个比较成功的应用是外挂知识库相比chatgpt这个知识库比较庞大效果比较好的接口外挂知识库大模型的方式可以在不损失太多效果的条件下获得数据安全二原理现在比较流行的一个方案是la

热门标签