Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
LLM系列
简介 小伙伴们好 我是 小窗幽记机器学习 的小编 卖热干面的小女孩 紧接前文 万字长文细说ChatGPT的前世今生 后续会尝试以理论 实践的方式逐步对主流的各大LLM进行实测和汉化 今天这篇关于Llama2的小作文其实比较长 所以分为上下两
LLM
人工智能
LLaMA
模型部署
【大模型】更强的 LLaMA2 来了,开源可商用、与 ChatGPT 齐平
大模型 可商用且更强的 LLaMA2 来了 LLaMA2 简介 论文 GitHub huggingface 模型列表 训练数据 训练信息 模型信息 许可证 参考 LLaMA2 简介 2023年7月19日 Meta 发布开源可商用模型 Lla
大语言模型
Llama2
ChatGPT
LLM
Llama2-Chinese项目:1-项目介绍和模型推理
Atom 7B与Llama2间的关系 Atom 7B是基于Llama2进行中文预训练的开源大模型 为什么叫原子呢 因为原子生万物 Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位 目前社区发布了6个模型 如下所示 Flag
Llama2Chinese项目
Llama2
LLM
模型预训练
模型微调
如何优雅地下载huggingface上模型,以llama2模型下载为例
背景 由于llama2模型的下载需要经过官方的授权 这就需要登陆hugging face的 对模型页面进行申请 等待审核通过后 才能够下载 如果在单纯用 git lfs 的方式进行下载 需要输入账号和密码 为了更快速地进行下载 既能够设置密
LLM
人工智能
模型下载
Huggingface
Code Llama: Open Foundation Models for Code
本文是LLM系列文章 针对 Code Llama Open Foundation Models for Code 的翻译 Code Llama 代码的开放基础模型 摘要 1 引言 2 Code Llama 专业化Llama2用于代码 3 结
LLM
LLaMA
人工智能
深度学习
Subgraph Retrieval Enhanced Model for Multi-hop Knowledge Base Question Answering
本文是LLM系列的文章 针对 Subgraph Retrieval Enhanced Model for Multi hop Knowledge Base Question Answering 的翻译 用于多跳知识库问答的子图检索增强模型
知识图谱
LLM
语言模型
文本异常检测
原文 简单的word2vec进行平均在句子语义相似性的计算上效果一般般 很好理解 我爱你和你爱我的句子含义不一样 但是直接进行平均最终的结果是一样的 这类策略忽略了item的顺序信息 不过对于无序的items来说问题不大吧 sif并没有解决
LLM数据准备amp处理
LLM
Automatically Correcting Large Language Models
本文是大模型相关领域的系列文章 针对 Automatically Correcting Large Language Models Surveying the landscape of diverse self correction str
LLM
综述文章
语言模型
人工智能
自然语言处理
文献阅读:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
文献阅读 Chain of Thought Prompting Elicits Reasoning in Large Language Models 1 文章简介 2 具体方法 3 实验结果 1 数学推理 1 实验设计 2 实验结果 3 消
文献阅读
自然语言处理
LLM
prompt tuning
prompt工程
ModelScope-Agent: Building Your Customizable Agent System with Open-source Large Language Models
本文是LLM系列文章 针对 ModelScope Agent Building Your Customizable Agent System with Open source Large Language Models 的翻译 ModelS
LLM
语言模型
人工智能
自然语言处理
如何有效进行RLHF的数据标注?
编者按 随着大语言模型在自然语言处理领域的广泛应用 如何从人类反馈进行强化学习 RLHF 已成为一个重要的技术挑战 并且RLHF需要大量高质量的人工数据标注 这是一个非常费力的过程 本文作者在数据标注领域具有丰富经验 他在本文深入探讨了RL
技术干货
RLHF
强化学习
数据标注
LLM
Secrets of RLHF in Large Language Models Part I: PPO
本文是LLM系列文章 针对 Secrets of RLHF in Large Language Models Part I PPO 的翻译 大型语言模型中RLHF的秘密 上 PPO 摘要 1 引言 2 相关工作 3 人类反馈的强化学习 4
LLM
语言模型
人工智能
自然语言处理
TOOLLLM: FACILITATING LARGE LANGUAGE MODELS TO MASTER 16000+ REAL-WORLD APIS
本文是LLM系列的文章之一 针对 TOOLLLM FACILITATING LARGE LANGUAGE MODELS TO MASTER 16000 REAL WORLD APIS 的翻译 TOOLLLMs 让大模型掌握16000 的真实
LLM
语言模型
人工智能
自然语言处理
Chatglm2-6b模型相关问题
Chatglm2 6b模型相关问题 1 Chatglm2 6b模型p tuning后推理答非所问 2 ChatGLM2 6b ptuning 3 ChatGLM2 6b部署 1 Chatglm2 6b模型p tuning后推理答非所问 据C
AIGC
LLM
chatglm2
ChatGLM
Using Large Language Models for Zero-Shot Natural Language Generation from Knowledge Graphs
本文是LLM系列文章 针对 Using Large Language Models for Zero Shot Natural Language Generation from Knowledge Graphs 的翻译 利用大型语言模型从知
知识图谱
LLM
语言模型
人工智能
LLM论文周报|来自谷歌、Meta AI、香港中文大学等机构前沿论文研究
大模型 LLM 是一种人工智能模型 旨在理解和生成人类语言 它们在大量的文本数据上进行训练 可以执行广泛的任务 包括文本总结 翻译 情感分析等等 LLM的特点是规模庞大 包含数十亿的参数 帮助它们学习语言数据中的复杂模式 这些模型通常基于深
人工智能
大模型
LLM
深度学习
AI
LangChain(6)构建用户自己的Agent
构建用户自己的Agent 编写简单的计算工具 编写有多个参数的工具 其它更高级的工具 LangChain 中有一些可用的Agent内置工具 但在实际应用中我们可能需要编写自己的Agent 编写简单的计算工具 pip install qU l
python
LLM
langchain
Agent
Meta算力争夺演变成团队动荡!LLaMA、LLaMA2、OPT团队成员多位离职
据TheInformation报道 原参与Llama项目的团队成员有多位已经辞职 原因是Meta内部的OPT研究团队与Llama团队之间发生了一场关于计算资源的内部斗争 看来不管是谷歌 微软 OpenAI还是Meta 人才流失都是一个避不开
LLaMA
人工智能
大模型
LLM
Meta AI
Knowledge Graph Prompting for Multi-Document Question Answering
本文是LLM系列文章 针对 Knowledge Graph Prompting for Multi Document Question Answering 的翻译 多文档问答中的知识图谱提示 摘要 1 引言 2 符号 3 知识图谱构建 4
知识图谱
LLM
人工智能
YaRN: Efficient Context Window Extension of Large Language Models
本文是LLM系列文章 针对 YaRN Efficient Context Window Extension of Large Language Models 的翻译 YaRN 大型语言模型的有效上下文窗口扩展 摘要 1 引言 2 背景和相关
LLM
语言模型
人工智能
自然语言处理
«
1
2
3
4
5
»