大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

2023-11-11

上期文章我们实现了Llama 2-chat-7B模型的云端部署和推理，本期文章我们将用“LangChain+Llama 2”的架构打造一个定制化的心灵疗愈机器人。有相关知识背景的读者可以直接阅读「实战」部分。

01 背景

1.1 微调 vs. 知识库

由于大模型在垂直行业领域的问答效果仍有待提升，因此，领域知识的注入成为了最直接的解决方案之一。知识注入方法可以分为领域微调（Fine-tuning）和外挂知识库（Knowledge Base）两种。

1. 领域微调

微调是通过少量特定用例的增量数据对基础模型进行进一步训练，改变其神经网络中的参数权重。微调适用于任务或域定义明确，且有足够的标记数据的场景，比如风格微调。目前常用的微调方法包括Freeze，P-tuning和LoRA，相关细节会在下期文章中详细介绍。

然而，微调方法的不足之处在于：

▪ 高质量训练数据集的构建，微调训练所需的算力以及微调模型定期更新等开销都不容小觑

▪ 试错成本较高，特定领域数据一般难以覆盖模型已学到的参数，且可能会导致模型其他下游任务的表现下降

2. 外挂知识库

外挂知识库的本质在于不修改基座模型参数，通过提示词工程（Prompt Engineering）将特定知识作为prompt中的context，即召回相关性最高的几个文档，让模型分析这些蕴含知识后，并返回答案。知识库适合要求输出明确且精度高的任务。

相对于微调，知识库的优势在于：

▪ 回答精确度更高，基于相关文档中的最相关特定段落进行语义搜索能消除查询歧义以生成更精确的答案

▪ 适应性更强，用户可以通过轻松更新信息源来调整和适配新的领域

但大模型上下文窗口长度的限制和Prompt的构造等因素带来的潜在精度下降也需要纳入知识库构建的考量。

为了打造特定领域（Domain-specific Knowledge）的知识问答系统，我们需要借助提供了外挂知识库的搜索方案LangChain框架。

1.2 LangChain模块

LangChain是一个由语言模型驱动的用于开发应用程序的框架。LangChain主要的两个能力是：

▪ Data-aware：将不同数据源接入到语言模型中

▪ Agentic：允许语言模型和LangChain环境交互

LangChain的核心模块包括Models，Prompts，Chains，Indexes，Agents等 [1]。对于每一个模块，LangChain都提供了标准化的可拓展接口。

图1：LangChain部分模块 [2]

除了用LLM Wrapper可以接入众多的大模型（如 OpenAI、Cohere、Hugging Face），LangChain同时也通过VectorStore Wrapper接口集成了主流的向量数据库（如 Milvus、Pinecone、Chroma等）来优化语义搜索。

LangChain能接入的数据类型涵盖了文本、PPT、图片、HTML、Pdf等非结构化文件。相较于传统数据库的精确搜索，即完全匹配，向量数据库使用最邻近（Approximate Nearest Neighbor，ANN）算法和相似度度量（如余弦相似度，内积等）来找到和查询问题最相似的向量。

基于本地知识库问答的大致流程如下：

加载文档 -> 文本拆分 -> 根据question/query语义检索匹配文本 -> 构建prompt -> LLM生成回答

这里以Milvus数据库和ChatGPT作为示例：

图2：LangChian + Milvus + ChatGPT pipeline [3]

02 实战

目前，我们已经拆解完了LangChain+LLM文档问答的大致链路，接下来我们正式进入实战环节。

2.1 环境搭建

a. 安装LangChain

确保Python 版本≥ 3.8.1 且 <4.0。

pip install langchain

b. 部署LLama 2

▪ 关于Llama 2模型的部署，详情可参见上期文章《大模型技术实践（二）｜关于Llama 2你需要知道的那些事儿》

▪ UCloud官方的“LLaMA2 模型快速部署”文档：https://docs.ucloud.cn/gpu/practice/LLaMA2?id=llama2-模型快速部署

c. 下载Embedding 模型

这里我们选择text2vec-large-chinese [4]这个Embedding模型，下载地址为：

https://huggingface.co/GanymedeNil/text2vec-large-chinese

对于中文的场景，也有其他优秀的开源模型可供选择，如m3e和bge等[5]。

d. 下载数据集

心灵鸡汤文本数据集：https://huggingface.co/datasets/soulteary/warm-chicken-soup/

这个数据集是从Google网页上爬取的一些心灵鸡汤引用短文，共包含631条文本

2.2 文档解析

a. 加载数据集

LangChain对于不同格式的数据源内置了不同的解析脚本，最终这些数据都将转换为纯txt文本格式，以实现文本标准化。

from langchain.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

loader = UnstructuredFileLoader("数据集存放地址")  
docs = loader.load()

b. 文本切分

文本切分中的chunk_size指定了切分后的文本块的字数，chunk_overlap指定了切分文本块之间的重叠字数。由于鸡汤引用文本总长度较短，且文本内部语义关联度高，所以这里的chunk_size设置为50，chunk_overlap设置为20。

text_splitter = RecursiveCharacterTextSplitter(chunk_size=50,chunk_overlap=20)
docs = text_splitter.split_documents(docs)

c. 文本嵌入和向量库

文本切分后，我们需要将文本进行向量化表示，将其映射为低维稠密的向量并存储到然向量数据库中。向量数据库选用了无需注册的FAISS。

from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

# 导入向量模型
import os
embeddings = HuggingFaceEmbeddings(
    model_name = "{你的地址}/text2vec-large-chinese",
    model_kwargs = {'device': 'cuda'})

# 如果没有本地faiss仓库，先读取doc向量库，再将向量库保存到本地
if os.path.exists("{你的地址}/my_faiss_store.faiss") == False:
    vector_store = FAISS.from_documents(docs,embeddings)
    vector_store.save_local("{你的地址}/my_faiss_store.faiss")
# 如果faiss仓库已存在，则直接读取
else:
    vector_store = FAISS.load_local(
    "{你的地址}/my_faiss_store.faiss",
    embeddings=embeddings)

2.3 加载模型

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载tokenizer
tokenizer = AutoTokenizer.from_pretrained(
    '/opt/Llama-2-7b-chat-hf',
    trust_remote_code=True)

# 加载模型 Llama 2-chat-7B
base_model = AutoModelForCausalLM.from_pretrained(
        "/opt/Llama-2-7b-chat-hf",
        torch_dtype=torch.float16,
        device_map='auto',
        trust_remote_code=True
    )
llm = base_model.eval()

2.4 语义检索

接下来，我就能根据构建好的向量数据库召回对应文本片段。

a. 向量化召回

FAISS默认使用L2（欧式距离），召回的文档按照相似度结果从大到小排序。

query = "面对求职屡屡碰壁的大学生，请说一句话来鼓励他？"
docs = vector_store.similarity_search(query) # 计算相似度，并把相似度高的chunk放在前面
context = [doc.page_content for doc in docs] # 提取chunk的文本内容
print(context)

b. 设置提示词模板

以下是Llama 2默认的提示词模板

 #qa_template = """Use the following pieces of information to answer the user's question.
 #If you don't know the answer, just say that you don't know, don't try to make up an answer.
 #Context: {context}
 #Question: {question}
 #Only return the helpful answer below and nothing else.
 #Helpful answer: """

我们可以参考上面的模板，根据场景定制化自己的模板来拼接Query和召回结果

context ="\n".join(context)
prompt = f"基于以上内容：\n{context} \n 请回答：{query} \n 字数限制在30字以内"

2.5 推理示例

我们对LLM的参数进行设置，例如最大令牌（max_new_tokens）、最高k值（top_k）、温度（temperature）和重复惩罚（repetition_penalty）等等。最后，将prompt喂给模型。

# 检查显存占用
nvidia-smi

inputs = tokenizer([f"Human:{prompt}\nAssistant:"], return_tensors="pt")
input_ids = inputs["input_ids"].to('cuda')

# llm参数设置
param_config = {
    "input_ids":input_ids,
    "max_new_tokens":1024,
    "do_sample":True,
    "top_k":5,
    "top_p":0.95,
    "temperature":0.1,
    "repetition_penalty":1.3
}
result  = llm.generate(**param_config)

answer = tokenizer.decode(result[0], skip_special_tokens=True)

print(answer)
# output example

# Q：面对求职屡屡碰壁的大学生，请说一句话来鼓励他？
# A：坚持不懈，机会终将降临

03 外挂知识库的问题和优化

3.1 LLM+Embedding-Search的局限

外挂知识库将用户问题和本地知识向量化，比较两者的向量相似度（Vector Similarity）进行召回。然而，这种全量的Embedding-Search在面对多知识点聚合处理的场景下，存在召回精度低的问题。因为知识库的构建是对单个知识点进行索引，而非对不同知识点的排列组合分别索引。

居里夫人的出生年月 -> 单索引
居里夫人、爱因斯坦、奥本海默的出生年月 -> 组合索引

Q: 居里夫人、爱因斯坦和奥本海默三人中谁最早出生？

为了避免召回遗漏，直观的处理方法包括降低相似度阈值（similarity score threshold）和增加召回数量（top_k），但这不免会引入无关的知识点噪声且增加和LLM交互的token开销。

3.2 效果优化方向

意图识别和召回优化

提升问答系统的精度可以从意图识别和召回优化两个角度考虑，且两者都可以用关键词表示，即从直接将用户query和知识点进行embedding转变为对两者提取关键词后再进行匹配。意图识别可以通过关键词提取（Information Extraction, IE）和槽位填充（Slot Filling，SF）实现。

1. 关键词提取

a. 面向query——槽位填充

利用LLM思维链（Chain-of-Thought，COT）的提示能力来引导用户多轮对话并进行信息总结。针对我们的心灵疗愈机器人的场景，比如用户查询心灵鸡汤的句子，那么就要求用户的提供年龄段，情绪问题和情感需求等信息。语义槽格式如下：

   "心灵鸡汤" : { 
        "用户年龄段" : ____, # 青年，中年，老年
        "情绪问题" : ____, # 焦虑，失恋
        "情感需求" : ____, # 寻求安慰，寻求激励
    }

b. 面向知识点——索引入口

对于知识点可以从以下两个方面考虑：

i. 对相同知识点建立多级索引，有助于实现对维度查询。比如对一位奥运冠军的姓名，竞赛项目，年龄，获奖时间等分别建立索引。

ii. 将知识库转化为以关系三元组为核心的知识图谱。三元组的抽取除了传统的命名实体识别（NER）等方法，也可以通过prompt让大模型来进行抽取。

基于关键词的embedding入库和搜索流程如下：

2. 多路召回

类似于Bert时代的垂直领域问答系统，我们可以将语义检索和传统的Elasticsearch（ES）关键词搜索并行，对两者进行加权打分投票来获取最终的top_k。

目前类似于以上优化思路已经落地的有“智海-录问”法律大模型 [6]，其基座模型为Baichuan-7B。智海-录问知识增强的完整链路如图3。值得注意的是，智海-录问在知识库中对每一个知识点是以 [key, value] pair 形式存储的。key是知识点的内容简介，用于检索；value是知识点的具体内容，用于模型输入。实现细节请参照其Hugging Face仓库。

图3：“智海-录问”知识增强链路

其他优化方向

除了Embedding部分，“LangChain+LLM”（图2）链路内的其他组件也有进一步优化的空间：

1. 知识库细化

当用户手动选择分区后，分区检索可以明显提高召回的精度。

图4：“智海-录问”的交互界面

2. 文本切分方式

由于文本重叠（overlap）的大小没有统一标准，如何保证语义完整和连贯都需要不断测试。

3. 提示词的质量

在提示词模板的设计上要增加明确约束条件的指令，减少大模型出现幻觉现象的几率。

4. 大模型的选型

选择基座模型还是微调后的模型，以及对中文的支持程度的需求都需要结合下游场景进行判别。

本期文章带你基于“LangChain+LLM”框架快速搭建了知识增强后的问答机器人——心灵疗愈师，并探讨了提升模型的内容理解和执行能力的潜在优化方向。

下期文章我们将深入解读目前主流的大模型微调技术，敬请期待～

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人的相关文章

AAAI 2024 一作讲者招募 | 持续报名中

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入我们诚挚地邀请您来AI TIME分享您发表在AAAI 2024的工作请您扫码填写以下问卷如内容合适我们将会与您沟通相关分享事宜 AAAI 2024预讲会计划时间 2024年1
欧盟反垄断主管即将会见库克，iPhone NFC功能要开放了？

1月5日路透社报道欧盟反垄断主管玛格丽特维斯塔格 Margrethe Vestager 即将在下周举办会议会见苹果博通英伟达等多个科技公司CEO 苹果首席执行官蒂姆库克 Tim Cook 就在其中欧盟反垄断想来大家应该已经不陌
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
利用CHAT写实验结论

问CHAT 通过观察放置在玻璃表面上的单个水滴人们可以观察到水滴充当成像系统探究这样一个透镜的放大倍数和分辨率 CHAT回复实验报告标题利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率一实验目的通过对比和测量研究和探索玻
基于java的ssh医院在线挂号系统设计与实现

基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机随着信息技术的迅速发展和应用医院在线挂号系统已成为医院管理的重要组成部分传统的挂号方式存在许多
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
Creator AIGC插件！一句话生成人脸

近几个月以来 AIGC 一路高歌猛进让我们见证了一场行业革命然而 AIGC 在 3D 资产领域却仍是业内的难题少有突破小编今天给大家推荐一个 3D 角色 AIGC 利器 ChatAvatar 它可以算是 3D AIGC 领域的一匹黑
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
性能大减80%，英伟达芯片在华“遇冷”，我方霸气回应：不强求

中国这么大一块市场谁看了不眼馋在科技实力大于一切的今天高端芯片的重要性不言而喻作为半导体产业发展过程中不可或缺的一环芯片技术也一直是我国技术发展的一大心病在美西方等国的联手压制下我国芯片技术发展处处受阻至今也未能在高端芯片
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技

随机推荐

物联网全称_物联网的魔力世界

物联网顾名思义就是一种万物相连的网英文全称 Internet of Things 缩写IoT 物联网可以让所有能行使独立功能的物体实现相互连接通过物联网技术可以用中心计算机对机器设备或人员进行集中管理控制也可以对家用电器汽车等
构建 react应用程序（二）（react-scripts实现原理）

在前面讲到了使用create react app来创建项目这节我们来分析下原理 react scripts有以下支持都帮你配置好了 React JSX ES6 and Flow syntax support Language extra
xShell操作Linux的常用命令

我们需要在本地连接Linux服务器可以用winscp来进行连接优点是图形化界面文件的层级关系类似于Windows 更容易操作也可以使用xShell来进行连接查看和操作文件就需要使用Linux命令文件的层级关系没有前者直观但作为
力扣刷题-210.课程表Ⅱ、图的表示方式、BFS

一图的基本概念定义和基本术语图是由节点以及连接这些节点边组成无向图每条边连接的两个节点可以双向访问有向图每条边连接的两个节点只能单向访问出度有向图的某个节点作为起点的次数和入度有向图的某个节点作为终点的次数和权重图
springMVC 绑定前台穿来的时间类型数据

当前台传来的数据对时间类型的数据其实是无法绑定的解决办法1 DataTimeFormat pattern yyyy MM dd 标注在实体类的时间字段上解释这个注解的支持是来自
Cmake简介和简单使用方法

cmake 简介 CMake是一个跨平台的安装编译工具可以用简单的语句来描述所有平台的安装编译过程他能够输出各种各样的makefile或者project文件能测试编译器所支持的C 特性类似UNIX下的automake CMak
定义字符串

目录一什么是字符串二定义字符串的具体格式三求字符数组和字符串长度比较一什么是字符串所谓字符串本质上就是以 0 作为结尾的特殊字符数组二定义字符串的具体格式 1 char 字符串名称字符串长度字符串所含元素注意点
LabView的简单例题，尽量做到一题多解

Question 1 亮灯难度以组合框为输入条件分别完成亮红灯亮黄灯亮绿灯灯全灭 Question 2 波形图和波形图表的区别难度在波形图和波形图表中显示一个sin函数 sin函数没有定性要求注意波形图表输入是数字而波
svn 命令行操作

文章目录 help checkout help svn help update up checkout co checkout checkout co svn co URL username xxx password xxx svn co
IMX6学习记录(10)-挂载SD卡，数据掉电存储

上面是我的微信和QQ群欢迎新朋友的加入目前使用的文件系统是打包成镜像文件的通过UBOOT挂载镜像在RAM里面运行起来了这有个问题数据不会被存储下来掉电就会丢失 1 挂载SD卡 fdisk l mount dev mmcblk0
Java垃圾回收器

Java垃圾回收器 1 GC分类与性能指标 1 1 垃圾回收器概述 1 2 垃圾回收器分类 1 2 1 按照线程分 1 2 2 按照工作模式分 1 2 3 碎片处理方式分 1 2 4 工作的内存区间分 1 3 评估GC的性能指标 1 4 吞
另一个Kubernetes（k8s）指南

从头开始学习Kubernetes Photo by Bobby Burch on Unsplash 近年来 Kubernetes k8s 的受欢迎程度激增如果您要部署许多容器化的应用程序那么无论在私有云还是公共云环境中 k8无疑都是当前
easyx图形库-----贴图技巧之双缓冲消除闪屏(BeginBatchDraw 与 EndBatchDraw）

目录前言案例1 作图时闪屏案例2 贴图时闪屏双缓冲解决闪屏问题原理前言学了easyx图形库的朋友们都知道我们可以在easyx图形库上面画出连续运动的图片或者通过贴图的方式把每一帧图片连起来达到动态效果但是我们每次贴完图片
【react从入门到精通】React父子组件通信方式详解（有示例）

文章目录人工智能福利文章前言 React技能树通过 props 实现父子组件通信通过 state 实现父子组件通信通过回调函数实现父子组件通信使用 React Context 实现组件通信总结写在最后人工智能福利文章分享
参考文献期刊首字大写_干货

解读论文写作与发表策略助您成功发表关注在论文的写作过程中参考文献必不可少参考文献的引用体现作者对所研究领域的熟悉程度作者的学术眼光以及对他人学术成果的尊重根据GB T 7714 2015 信息与文献参考文献著录规则参考文献
给大家排个雷，ensp中nat不成功原因

用ensp做网络设计 nat一直不成功内网ping外网能通但是抓包显示地址没有转换成功检查了所有配置没问题最后将Router换成了AR1 配置不变实验成功建议大家以后做实验不要用Router
Docker中搭建FastDFS文件系统（多图）

关于FastDFS FastDFS 是以 C 语言开发的一项开源轻量级分布式文件系统他对文件进行管理主要功能有文件存储文件同步文件访问文件上传下载等特别适合以文件为载体的在线服务如图片网站视频网站等外话 FastD
一种排序方法 C#

int array new int 10 3 2 4 90 50 20 34 22 49 int newArray new int array Length int Min 100000000 for int i 0 i lt array
【习题之Python篇】习题4

1 输入一个字符串内容是个带小数的实数例如123 45 输出是两个整数变量x和y x是整数部分123 y是小数部分45 s input 输入带小数的数字 s s split print int s 0 是整数部分 int s 1 是小数
大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

上期文章我们实现了Llama 2 chat 7B模型的云端部署和推理本期文章我们将用 LangChain Llama 2 的架构打造一个定制化的心灵疗愈机器人有相关知识背景的读者可以直接阅读实战部分 01 nbsp 背景 1 1 微

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人

01&nbsp;背景

02&nbsp;实战

03&nbsp;外挂知识库的问题和优化

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人 的相关文章

随机推荐

热门标签

01 背景

02 实战

03 外挂知识库的问题和优化

大模型技术实践（三）｜用LangChain和Llama 2打造心灵疗愈机器人的相关文章