大模型

使用 PAI-Blade 加速 StableDiffusion Fine-Tuning

01 背景 Stable Diffusion 模型自从发布以来在互联网上发展迅猛它可以根据用户输入的文本描述信息生成相关图片用户也可以提供自己喜爱的风格的照片来对模型进行微调例如当我们输入 A photo of sks dog in

大模型理论与实战 大模型 stable diffusion 大数据 人工智能

行业大模型训练经验分享&落地思考

大家好行业大模型一直是大家关注的内容恰逢我司也做了行业知识大模型借此机会聊一聊行业大模型训练Trick以及行业大模型落地想法但有些并没有什么理论依据全是自己的实验经验结论可能跟大家有所不同喜欢欢迎点赞收藏关注文末提供技

大模型 大模型理论与实战 Pytorch ChatGPT 大数据

LoRA 微调大模型的实践经验总结

前两天 SEBASTIAN RASCHKA 博士发了一篇博客介绍了使用LoRA微调大模型的一些实践经验个人觉得有一定参考价值总结一下分享给大家喜欢记得收藏点赞关注文末附上原文欢迎品读简单介绍下什么是LoRA 在深度学习领域

大模型理论与实战 大模型 人工智能 算法 langchain

通用大模型训练过程必须经历的四个阶段！

上图来自 Andrej Karpathy 深度学习的大拿目前在Tesla 这张图的信息量相当大通过该图能让我们对大模型的整个训练过程有一个总体的了解从该图可知大模型训练主要有4步 Pretraining 预训练阶段 Supervise

大模型理论与实战 大模型 人工智能 大数据 ChatGPT

大模型下开源文档解析工具总结及技术思考

1 基于文档解析工具的方法 pdf解析工具导图一览 PyPDF2提取txt import PyPDF2 def extract text from pdf pdf path with open pdf path rb as file pd

大模型 大模型理论与实战 人工智能 算法 langchain

拆解大语言模型 RLHF 中的PPO算法

为什么大多数介绍大语言模型 RLHF 的文章一讲到 PPO 算法的细节就戛然而止了呢要么直接略过要么就只扔出一个 PPO 的链接然而 LLM x PPO 跟传统的 PPO 还是有些不同的呀其实在 ChatGPT 推出后的相当一段时

大模型理论与实战 大模型 语言模型 算法 人工智能

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例从代码级别详细分享AI框架LangChain 阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践给大家快速落地AIGC应用提供参考前言通义模型具备的能

大模型理论与实战 大模型 langchain ChatGPT 人工智能

让老板成为数据分析师，我用 ChatGpt 链接本地数据源实战测试

本文探究 ChatGpt 等AI机器人能否帮助老板快速的做数据分析用自然语言同老板进行沟通满足老板的所有数据分析的诉求一背景设想这样一个场景你是某贸易公司的老板公司所有的日常运转数据都在私域的进销存系统包括客户供应商销售

大模型理论与实战 大模型 ChatGPT 人工智能 机器学习

云音乐大模型 Agent 探索实践

一前言本篇文章介绍了大语言模型时代下的 AI Agent 概念并以 LangChain 为例详细介绍了 AI Agent 背后的实现原理随后展开介绍云音乐在实践 AI Agent 过程中的遇到的问题及优化手段通过阅读本篇文章读者

大模型理论与实战 大模型 人工智能 大数据 ChatGPT

教你5步学会用Llama2：我见过最简单的大模型教学

在这篇博客中 Meta 探讨了使用 Llama 2 的五个步骤以便使用者在自己的项目中充分利用 Llama 2 的优势同时详细介绍 Llama 2 的关键概念设置方法可用资源并提供一步步设置和运行 Llama 2 的流程 Meta

学习笔记 大模型 大模型理论与实战 学习方法 机器学习

Lag-Llama：基于 LlaMa 的单变量时序预测基础模型

文章构建了一个通用单变量概率时间预测模型 Lag Llama 在来自Monash Time Series库中的大量时序数据上进行了训练并表现出良好的零样本预测能力在介绍Lag Llama之前这里简单说明什么是概率时间预测模型概率预测

大模型理论与实战 LLaMA 算法 人工智能 大模型

用通俗的方法讲解：大模型微调训练详细说明（附理论+实践代码）

本文内容如下介绍了大模型训练的微调方法包括prompt tuning prefix tuning LoRA p tuning和AdaLoRA等介绍了使用deepspeed和LoRA进行大模型训练的相关代码给出了petals的介绍它

大模型理论与实战 大模型 Pytorch 深度学习 python

一文搞懂 chatGPT 原理

目前关于chatGPT的资料过于零散没有详尽所有知识点系统概述的文章因此笔者作了这篇总结性文章训练过程总览理清演化路径预训练 pretrain GPT 3概述 GPT 3模型的理念 GPT 3如何学习数据集指令微调 Ins

大模型理论与实战 大模型 ChatGPT 人工智能 算法

文心千帆为你而来

1 前言 3月16号百度率先发布了国内第一个人工智能大语言模型文心一言文心一言的发布在业界引起了不小的震动而文心一言的企业服务则由文心千帆大模型平台提供文心千帆大模型平台是百度智能云打造出来的一站式大模型开发与应用平台提供包括文心

玩转ChatGPT ChatGPT说 gpt 大模型 文心一言

oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程）

原文 oobabooga text generation webui可能是最好的语言模型启动器包含手把手安装教程哔哩哔哩引言问 oobabooga是什么 oobabooga text generation webui是一个用于运行类

大模型 人工智能 ChatGPT 语言模型

LLaMA开源语言模型泄漏版下载

Meta Facebook 开源语言模型LLaMA泄漏版国内网盘下载该语言模型据说是比openAI的ChatGPT能力更强的虽说是开源语言模型但如果想要直接使用还是需要通过Edu教育邮箱来申请资格的得到批复邮件之后可以做为科学研

人工智能 大模型 LLaMA

数据决定AIGC的高度，什么又决定着数据的深度？

有人曾言数据决定人工智能发展的天花板深以为然随着ChatGPT等AIGC应用所展现出的强大能力人们意识到通用人工智能的奇点正在来临越来越多的企业开始涌入这条赛道在AIGC浪潮席卷全球之际数据的重要性也愈发被业界所认同之所以会

AIGC 大模型 人工智能 分布式存储 AS13000

基于LLMs的多模态大模型（Flamingo, BLIP-2，KOSMOS-1，ScienceQA）

前一篇博客已经整理了不训练视觉模型的文章们基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 本篇文章将介绍一些需要训练视觉编码器来适配多模态大模型的工作们这也是目前最为流行的研究思路其实

深度学习 多媒体和多模态 人工智能 大模型 预训练

Augmented Language Models（增强语言模型）

Augmented Language Models A Survey 先上地址 https arxiv org pdf 2302 07842 pdf 概率论难以支撑通用人工智能技术的诞生 Yann LeCun LLMs取得的巨大进展不再多说

深度学习 预训练 大模型 语言模型 增强语言模型

大模型训练避坑指南

原文 https baijiahao baidu com s id 1760862056681517207 wfr spider for pc 自 2022 年 11 月底 ChatGPT 发布以来大模型的热度持续发酵相信高屋建瓴的讨论

大模型 自然语言 人工智能 机器学习 自然语言处理