Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 PAI-Blade 加速 StableDiffusion Fine-Tuning
01 背景 Stable Diffusion 模型自从发布以来在互联网上发展迅猛 它可以根据用户输入的文本描述信息生成相关图片 用户也可以提供自己喜爱的风格的照片 来对模型进行微调 例如当我们输入 A photo of sks dog in
大模型理论与实战
大模型
stable diffusion
大数据
人工智能
行业大模型训练经验分享&落地思考
大家好 行业大模型一直是大家关注的内容 恰逢我司也做了行业知识大模型 借此机会聊一聊行业大模型训练Trick以及行业大模型落地想法 但有些并没有什么理论依据 全是自己的实验经验 结论 可能跟大家有所不同 喜欢欢迎点赞 收藏 关注 文末提供技
大模型
大模型理论与实战
Pytorch
ChatGPT
大数据
LoRA 微调大模型的实践经验总结
前两天 SEBASTIAN RASCHKA 博士发了一篇博客介绍了使用LoRA微调大模型的一些实践经验 个人觉得有一定参考价值 总结一下分享给大家 喜欢记得收藏 点赞 关注 文末附上原文 欢迎品读 简单介绍下什么是LoRA 在深度学习领域
大模型理论与实战
大模型
人工智能
算法
langchain
通用大模型训练过程必须经历的四个阶段!
上图来自 Andrej Karpathy 深度学习的大拿 目前在Tesla 这张图的信息量相当大 通过该图能让我们对大模型的整个训练过程有一个总体的了解 从该图可知大模型训练主要有4步 Pretraining 预训练阶段 Supervise
大模型理论与实战
大模型
人工智能
大数据
ChatGPT
大模型下开源文档解析工具总结及技术思考
1 基于文档解析工具的方法 pdf解析工具 导图一览 PyPDF2提取txt import PyPDF2 def extract text from pdf pdf path with open pdf path rb as file pd
大模型
大模型理论与实战
人工智能
算法
langchain
拆解大语言模型 RLHF 中的PPO算法
为什么大多数介绍大语言模型 RLHF 的文章 一讲到 PPO 算法的细节就戛然而止了呢 要么直接略过 要么就只扔出一个 PPO 的链接 然而 LLM x PPO 跟传统的 PPO 还是有些不同的呀 其实在 ChatGPT 推出后的相当一段时
大模型理论与实战
大模型
语言模型
算法
人工智能
LangChain+通义千问+AnalyticDB向量引擎保姆级教程
本文以构建AIGC落地应用ChatBot和构建AI Agent为例 从代码级别详细分享AI框架LangChain 阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践 给大家快速落地AIGC应用提供参考 前言 通义模型具备的能
大模型理论与实战
大模型
langchain
ChatGPT
人工智能
让老板成为数据分析师,我用 ChatGpt 链接本地数据源实战测试
本文探究 ChatGpt 等AI机器人能否帮助老板快速的做数据分析 用自然语言同老板进行沟通 满足老板的所有数据分析的诉求 一 背景 设想这样一个场景 你是某贸易公司的老板 公司所有的日常运转数据都在私域的进销存系统 包括客户 供应商 销售
大模型理论与实战
大模型
ChatGPT
人工智能
机器学习
云音乐大模型 Agent 探索实践
一 前言 本篇文章介绍了大语言模型时代下的 AI Agent 概念 并以 LangChain 为例详细介绍了 AI Agent 背后的实现原理 随后展开介绍云音乐在实践 AI Agent 过程中的遇到的问题及优化手段 通过阅读本篇文章 读者
大模型理论与实战
大模型
人工智能
大数据
ChatGPT
教你5步学会用Llama2:我见过最简单的大模型教学
在这篇博客中 Meta 探讨了使用 Llama 2 的五个步骤 以便使用者在自己的项目中充分利用 Llama 2 的优势 同时详细介绍 Llama 2 的关键概念 设置方法 可用资源 并提供一步步设置和运行 Llama 2 的流程 Meta
学习笔记
大模型
大模型理论与实战
学习方法
机器学习
Lag-Llama:基于 LlaMa 的单变量时序预测基础模型
文章构建了一个通用单变量概率时间预测模型 Lag Llama 在来自Monash Time Series库中的大量时序数据上进行了训练 并表现出良好的零样本预测能力 在介绍Lag Llama之前 这里简单说明什么是概率时间预测模型 概率预测
大模型理论与实战
LLaMA
算法
人工智能
大模型
用通俗的方法讲解:大模型微调训练详细说明(附理论+实践代码)
本文内容如下 介绍了大模型训练的微调方法 包括prompt tuning prefix tuning LoRA p tuning和AdaLoRA等 介绍了使用deepspeed和LoRA进行大模型训练的相关代码 给出了petals的介绍 它
大模型理论与实战
大模型
Pytorch
深度学习
python
一文搞懂 chatGPT 原理
目前关于chatGPT的资料过于零散 没有详尽所有知识点 系统概述的文章 因此 笔者作了这篇总结性文章 训练过程总览 理清演化路径 预训练 pretrain GPT 3概述 GPT 3模型的理念 GPT 3如何学习 数据集 指令微调 Ins
大模型理论与实战
大模型
ChatGPT
人工智能
算法
文心千帆为你而来
1 前言 3月16号百度率先发布了国内第一个人工智能大语言模型 文心一言 文心一言的发布在业界引起了不小的震动 而文心一言的企业服务则由文心千帆大模型平台提供 文心千帆大模型平台是百度智能云打造出来的一站式大模型开发与应用平台 提供包括文心
玩转ChatGPT
ChatGPT说
gpt
大模型
文心一言
oobabooga-text-generation-webui可能是最好的语言模型启动器(包含手把手安装教程)
原文 oobabooga text generation webui可能是最好的语言模型启动器 包含手把手安装教程 哔哩哔哩 引言 问 oobabooga是什么 oobabooga text generation webui是一个用于运行类
大模型
人工智能
ChatGPT
语言模型
LLaMA开源语言模型泄漏版下载
Meta Facebook 开源语言模型LLaMA泄漏版国内网盘下载 该语言模型据说是比openAI的ChatGPT能力更强的 虽说是开源语言模型 但如果想要直接使用 还是需要通过Edu教育邮箱来申请资格的 得到批复邮件之后 可以做为科学研
人工智能
大模型
LLaMA
数据决定AIGC的高度,什么又决定着数据的深度?
有人曾言 数据决定人工智能发展的天花板 深以为然 随着ChatGPT等AIGC应用所展现出的强大能力 人们意识到通用人工智能的奇点正在来临 越来越多的企业开始涌入这条赛道 在AIGC浪潮席卷全球之际 数据的重要性也愈发被业界所认同 之所以会
AIGC
大模型
人工智能
分布式存储
AS13000
基于LLMs的多模态大模型(Flamingo, BLIP-2,KOSMOS-1,ScienceQA)
前一篇博客已经整理了不训练视觉模型的文章们 基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 本篇文章将介绍一些需要训练视觉编码器来适配多模态大模型的工作们 这也是目前最为流行的研究思路 其实
深度学习
多媒体和多模态
人工智能
大模型
预训练
Augmented Language Models(增强语言模型)
Augmented Language Models A Survey 先上地址 https arxiv org pdf 2302 07842 pdf 概率论难以支撑通用人工智能技术的诞生 Yann LeCun LLMs取得的巨大进展不再多说
深度学习
预训练
大模型
语言模型
增强语言模型
大模型训练避坑指南
原文 https baijiahao baidu com s id 1760862056681517207 wfr spider for pc 自 2022 年 11 月底 ChatGPT 发布以来 大模型的热度持续发酵 相信高屋建瓴的讨论
大模型
自然语言
人工智能
机器学习
自然语言处理
«
1
2
3
4
5
6
»