LLM

LLM系列

简介小伙伴们好我是小窗幽记机器学习的小编卖热干面的小女孩紧接前文万字长文细说ChatGPT的前世今生后续会尝试以理论实践的方式逐步对主流的各大LLM进行实测和汉化今天这篇关于Llama2的小作文其实比较长所以分为上下两

LLM 人工智能 LLaMA 模型部署

【大模型】更强的 LLaMA2 来了，开源可商用、与 ChatGPT 齐平

大模型可商用且更强的 LLaMA2 来了 LLaMA2 简介论文 GitHub huggingface 模型列表训练数据训练信息模型信息许可证参考 LLaMA2 简介 2023年7月19日 Meta 发布开源可商用模型 Lla

大语言模型 Llama2 ChatGPT LLM

Llama2-Chinese项目：1-项目介绍和模型推理

Atom 7B与Llama2间的关系 Atom 7B是基于Llama2进行中文预训练的开源大模型为什么叫原子呢因为原子生万物 Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位目前社区发布了6个模型如下所示 Flag

Llama2Chinese项目 Llama2 LLM 模型预训练 模型微调

如何优雅地下载huggingface上模型，以llama2模型下载为例

背景由于llama2模型的下载需要经过官方的授权这就需要登陆hugging face的对模型页面进行申请等待审核通过后才能够下载如果在单纯用 git lfs 的方式进行下载需要输入账号和密码为了更快速地进行下载既能够设置密

LLM 人工智能 模型下载 Huggingface

Code Llama: Open Foundation Models for Code

本文是LLM系列文章针对 Code Llama Open Foundation Models for Code 的翻译 Code Llama 代码的开放基础模型摘要 1 引言 2 Code Llama 专业化Llama2用于代码 3 结

LLM LLaMA 人工智能 深度学习

Subgraph Retrieval Enhanced Model for Multi-hop Knowledge Base Question Answering

本文是LLM系列的文章针对 Subgraph Retrieval Enhanced Model for Multi hop Knowledge Base Question Answering 的翻译用于多跳知识库问答的子图检索增强模型

知识图谱 LLM 语言模型

文本异常检测

原文简单的word2vec进行平均在句子语义相似性的计算上效果一般般很好理解我爱你和你爱我的句子含义不一样但是直接进行平均最终的结果是一样的这类策略忽略了item的顺序信息不过对于无序的items来说问题不大吧 sif并没有解决

LLM数据准备amp处理 LLM

Automatically Correcting Large Language Models

本文是大模型相关领域的系列文章针对 Automatically Correcting Large Language Models Surveying the landscape of diverse self correction str

LLM 综述文章 语言模型 人工智能 自然语言处理

文献阅读：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

文献阅读 Chain of Thought Prompting Elicits Reasoning in Large Language Models 1 文章简介 2 具体方法 3 实验结果 1 数学推理 1 实验设计 2 实验结果 3 消

文献阅读 自然语言处理 LLM prompt tuning prompt工程

ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models

本文是LLM系列文章针对 ModelScope Agent Building Your Customizable Agent System with Open source Large Language Models 的翻译 ModelS

LLM 语言模型 人工智能 自然语言处理

如何有效进行RLHF的数据标注？

编者按随着大语言模型在自然语言处理领域的广泛应用如何从人类反馈进行强化学习 RLHF 已成为一个重要的技术挑战并且RLHF需要大量高质量的人工数据标注这是一个非常费力的过程本文作者在数据标注领域具有丰富经验他在本文深入探讨了RL

技术干货 RLHF 强化学习 数据标注 LLM

Secrets of RLHF in Large Language Models Part I: PPO

本文是LLM系列文章针对 Secrets of RLHF in Large Language Models Part I PPO 的翻译大型语言模型中RLHF的秘密上 PPO 摘要 1 引言 2 相关工作 3 人类反馈的强化学习 4

LLM 语言模型 人工智能 自然语言处理

TOOLLLM: FACILITATING LARGE LANGUAGE MODELS TO MASTER 16000+ REAL-WORLD APIS

本文是LLM系列的文章之一针对 TOOLLLM FACILITATING LARGE LANGUAGE MODELS TO MASTER 16000 REAL WORLD APIS 的翻译 TOOLLLMs 让大模型掌握16000 的真实

LLM 语言模型 人工智能 自然语言处理

Chatglm2-6b模型相关问题

Chatglm2 6b模型相关问题 1 Chatglm2 6b模型p tuning后推理答非所问 2 ChatGLM2 6b ptuning 3 ChatGLM2 6b部署 1 Chatglm2 6b模型p tuning后推理答非所问据C

AIGC LLM chatglm2 ChatGLM

Using Large Language Models for Zero-Shot Natural Language Generation from Knowledge Graphs

本文是LLM系列文章针对 Using Large Language Models for Zero Shot Natural Language Generation from Knowledge Graphs 的翻译利用大型语言模型从知

知识图谱 LLM 语言模型 人工智能

LLM论文周报｜来自谷歌、Meta AI、香港中文大学等机构前沿论文研究

大模型 LLM 是一种人工智能模型旨在理解和生成人类语言它们在大量的文本数据上进行训练可以执行广泛的任务包括文本总结翻译情感分析等等 LLM的特点是规模庞大包含数十亿的参数帮助它们学习语言数据中的复杂模式这些模型通常基于深

人工智能 大模型 LLM 深度学习 AI

LangChain（6）构建用户自己的Agent

构建用户自己的Agent 编写简单的计算工具编写有多个参数的工具其它更高级的工具 LangChain 中有一些可用的Agent内置工具但在实际应用中我们可能需要编写自己的Agent 编写简单的计算工具 pip install qU l

python LLM langchain Agent

Meta算力争夺演变成团队动荡！LLaMA、LLaMA2、OPT团队成员多位离职

据TheInformation报道原参与Llama项目的团队成员有多位已经辞职原因是Meta内部的OPT研究团队与Llama团队之间发生了一场关于计算资源的内部斗争看来不管是谷歌微软 OpenAI还是Meta 人才流失都是一个避不开

LLaMA 人工智能 大模型 LLM Meta AI

Knowledge Graph Prompting for Multi-Document Question Answering

本文是LLM系列文章针对 Knowledge Graph Prompting for Multi Document Question Answering 的翻译多文档问答中的知识图谱提示摘要 1 引言 2 符号 3 知识图谱构建 4

知识图谱 LLM 人工智能

YaRN: Efficient Context Window Extension of Large Language Models

本文是LLM系列文章针对 YaRN Efficient Context Window Extension of Large Language Models 的翻译 YaRN 大型语言模型的有效上下文窗口扩展摘要 1 引言 2 背景和相关

LLM 语言模型 人工智能 自然语言处理