Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
拆解大语言模型 RLHF 中的PPO算法
为什么大多数介绍大语言模型 RLHF 的文章 一讲到 PPO 算法的细节就戛然而止了呢 要么直接略过 要么就只扔出一个 PPO 的链接 然而 LLM x PPO 跟传统的 PPO 还是有些不同的呀 其实在 ChatGPT 推出后的相当一段时
大模型理论与实战
大模型
语言模型
算法
人工智能
LangChain+通义千问+AnalyticDB向量引擎保姆级教程
本文以构建AIGC落地应用ChatBot和构建AI Agent为例 从代码级别详细分享AI框架LangChain 阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践 给大家快速落地AIGC应用提供参考 前言 通义模型具备的能
大模型理论与实战
大模型
langchain
ChatGPT
人工智能
让老板成为数据分析师,我用 ChatGpt 链接本地数据源实战测试
本文探究 ChatGpt 等AI机器人能否帮助老板快速的做数据分析 用自然语言同老板进行沟通 满足老板的所有数据分析的诉求 一 背景 设想这样一个场景 你是某贸易公司的老板 公司所有的日常运转数据都在私域的进销存系统 包括客户 供应商 销售
大模型理论与实战
大模型
ChatGPT
人工智能
机器学习
云音乐大模型 Agent 探索实践
一 前言 本篇文章介绍了大语言模型时代下的 AI Agent 概念 并以 LangChain 为例详细介绍了 AI Agent 背后的实现原理 随后展开介绍云音乐在实践 AI Agent 过程中的遇到的问题及优化手段 通过阅读本篇文章 读者
大模型理论与实战
大模型
人工智能
大数据
ChatGPT
教你5步学会用Llama2:我见过最简单的大模型教学
在这篇博客中 Meta 探讨了使用 Llama 2 的五个步骤 以便使用者在自己的项目中充分利用 Llama 2 的优势 同时详细介绍 Llama 2 的关键概念 设置方法 可用资源 并提供一步步设置和运行 Llama 2 的流程 Meta
学习笔记
大模型
大模型理论与实战
学习方法
机器学习
Lag-Llama:基于 LlaMa 的单变量时序预测基础模型
文章构建了一个通用单变量概率时间预测模型 Lag Llama 在来自Monash Time Series库中的大量时序数据上进行了训练 并表现出良好的零样本预测能力 在介绍Lag Llama之前 这里简单说明什么是概率时间预测模型 概率预测
大模型理论与实战
LLaMA
算法
人工智能
大模型
用通俗的方法讲解:大模型微调训练详细说明(附理论+实践代码)
本文内容如下 介绍了大模型训练的微调方法 包括prompt tuning prefix tuning LoRA p tuning和AdaLoRA等 介绍了使用deepspeed和LoRA进行大模型训练的相关代码 给出了petals的介绍 它
大模型理论与实战
大模型
Pytorch
深度学习
python
一文搞懂 chatGPT 原理
目前关于chatGPT的资料过于零散 没有详尽所有知识点 系统概述的文章 因此 笔者作了这篇总结性文章 训练过程总览 理清演化路径 预训练 pretrain GPT 3概述 GPT 3模型的理念 GPT 3如何学习 数据集 指令微调 Ins
大模型理论与实战
大模型
ChatGPT
人工智能
算法
用通俗易懂的方式讲解大模型分布式训练并行技术:概述
近年来 随着Transformer MOE架构的提出 使得深度学习模型轻松突破上万亿规模参数 传统的单机单卡模式已经无法满足超大模型进行训练的要求 因此 我们需要基于单机多卡 甚至是多机多卡进行分布式大模型的训练 而利用AI集群 使深度学习
大模型理论与实战
分布式
«
1
2