预训练

预训练模型与微调

前言预训练模型已经火了这么久了但作为菜本菜的我却还在用lstm 在生成任务上与同门学长用的预训练模型相比效果差的比较明显所以我决定走上预训练的不归路以下分享我的学习过程了解模型小说故事生成模型万事开头难上视频视频我喜欢

预训练 LSTM 深度学习 机器学习

前一篇博客已经整理了不训练视觉模型的文章们基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 本篇文章将介绍一些需要训练视觉编码器来适配多模态大模型的工作们这也是目前最为流行的研究思路其实

深度学习 多媒体和多模态 人工智能 大模型 预训练

Augmented Language Models A Survey 先上地址 https arxiv org pdf 2302 07842 pdf 概率论难以支撑通用人工智能技术的诞生 Yann LeCun LLMs取得的巨大进展不再多说

深度学习 预训练 大模型 语言模型 增强语言模型

前一篇博文整理了 LLMs开源模型们和数据集简介这篇博文主要整理一下目前流行的训练方法和量化图自Towards a Unified View of Parameter Efficient Transfer Learning Tuning

深度学习 开源 预训练 大模型 分布式

ACM SIGKDD 国际数据挖掘与知识发现大会简称KDD 会议始于1989年是数据挖掘领域历史最悠久规模最大的国际顶级学术会议也是首个引入大数据数据科学预测分析众包等概念的会议每年吸引了大量数据挖掘机器学习大数据和人工

KDD KDD2023 预训练 学术论文 人工智能

在前面两篇博文中已经粗略介绍了增强语言模型和Tool Learning 本篇文章看四篇代表性的自动化框架 HuggingGPT AutoGPT WebGPT WebCPM Augmented Language Models 增强语言模型 T

深度学习 python 人工智能 预训练 大模型

这个系列已经更文一些了如果有新的文章会继续补充基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 基于LLMs的多模态大模型 Flamingo BLIP 2 KOSMOS 1 基于LLMs的

深度学习 多媒体和多模态 人工智能 预训练 大模型