大模型理论与实战

拆解大语言模型 RLHF 中的PPO算法

为什么大多数介绍大语言模型 RLHF 的文章一讲到 PPO 算法的细节就戛然而止了呢要么直接略过要么就只扔出一个 PPO 的链接然而 LLM x PPO 跟传统的 PPO 还是有些不同的呀其实在 ChatGPT 推出后的相当一段时

大模型理论与实战 大模型 语言模型 算法 人工智能

本文以构建AIGC落地应用ChatBot和构建AI Agent为例从代码级别详细分享AI框架LangChain 阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践给大家快速落地AIGC应用提供参考前言通义模型具备的能

大模型理论与实战 大模型 langchain ChatGPT 人工智能

本文探究 ChatGpt 等AI机器人能否帮助老板快速的做数据分析用自然语言同老板进行沟通满足老板的所有数据分析的诉求一背景设想这样一个场景你是某贸易公司的老板公司所有的日常运转数据都在私域的进销存系统包括客户供应商销售

大模型理论与实战 大模型 ChatGPT 人工智能 机器学习

一前言本篇文章介绍了大语言模型时代下的 AI Agent 概念并以 LangChain 为例详细介绍了 AI Agent 背后的实现原理随后展开介绍云音乐在实践 AI Agent 过程中的遇到的问题及优化手段通过阅读本篇文章读者

大模型理论与实战 大模型 人工智能 大数据 ChatGPT

在这篇博客中 Meta 探讨了使用 Llama 2 的五个步骤以便使用者在自己的项目中充分利用 Llama 2 的优势同时详细介绍 Llama 2 的关键概念设置方法可用资源并提供一步步设置和运行 Llama 2 的流程 Meta

学习笔记 大模型 大模型理论与实战 学习方法 机器学习

文章构建了一个通用单变量概率时间预测模型 Lag Llama 在来自Monash Time Series库中的大量时序数据上进行了训练并表现出良好的零样本预测能力在介绍Lag Llama之前这里简单说明什么是概率时间预测模型概率预测

大模型理论与实战 LLaMA 算法 人工智能 大模型

本文内容如下介绍了大模型训练的微调方法包括prompt tuning prefix tuning LoRA p tuning和AdaLoRA等介绍了使用deepspeed和LoRA进行大模型训练的相关代码给出了petals的介绍它

大模型理论与实战 大模型 Pytorch 深度学习 python

目前关于chatGPT的资料过于零散没有详尽所有知识点系统概述的文章因此笔者作了这篇总结性文章训练过程总览理清演化路径预训练 pretrain GPT 3概述 GPT 3模型的理念 GPT 3如何学习数据集指令微调 Ins

大模型理论与实战 大模型 ChatGPT 人工智能 算法

近年来随着Transformer MOE架构的提出使得深度学习模型轻松突破上万亿规模参数传统的单机单卡模式已经无法满足超大模型进行训练的要求因此我们需要基于单机多卡甚至是多机多卡进行分布式大模型的训练而利用AI集群使深度学习

大模型理论与实战 分布式