Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
预训练模型与微调
前言 预训练模型已经火了这么久了 但作为菜本菜的我却还在用lstm 在生成任务上与同门学长用的预训练模型相比 效果差的比较明显 所以 我决定走上预训练的不归路 以下分享我的学习过程 了解模型 小说故事生成模型 万事开头难 上视频 视频我喜欢
预训练
LSTM
深度学习
机器学习
基于LLMs的多模态大模型(Flamingo, BLIP-2,KOSMOS-1,ScienceQA)
前一篇博客已经整理了不训练视觉模型的文章们 基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 本篇文章将介绍一些需要训练视觉编码器来适配多模态大模型的工作们 这也是目前最为流行的研究思路 其实
深度学习
多媒体和多模态
人工智能
大模型
预训练
Augmented Language Models(增强语言模型)
Augmented Language Models A Survey 先上地址 https arxiv org pdf 2302 07842 pdf 概率论难以支撑通用人工智能技术的诞生 Yann LeCun LLMs取得的巨大进展不再多说
深度学习
预训练
大模型
语言模型
增强语言模型
LLMs开源模型们的分布式训练和量化
前一篇博文整理了 LLMs开源模型们和数据集简介 这篇博文主要整理一下目前流行的训练方法和量化 图自Towards a Unified View of Parameter Efficient Transfer Learning Tuning
深度学习
开源
预训练
大模型
分布式
KDD2023丨预训练论文合集
ACM SIGKDD 国际数据挖掘与知识发现大会 简称KDD 会议始于1989年 是数据挖掘领域历史最悠久 规模最大的国际顶级学术会议 也是首个引入大数据 数据科学 预测分析 众包等概念的会议 每年吸引了大量数据挖掘 机器学习 大数据和人工
KDD
KDD2023
预训练
学术论文
人工智能
LLMs的自动化工具系统(HuggingGPT、AutoGPT、WebGPT、WebCPM)
在前面两篇博文中已经粗略介绍了增强语言模型和Tool Learning 本篇文章看四篇代表性的自动化框架 HuggingGPT AutoGPT WebGPT WebCPM Augmented Language Models 增强语言模型 T
深度学习
python
人工智能
预训练
大模型
基于LLMs的多模态大模型(PALM-E,ArtGPT-4,VPGTrans )
这个系列已经更文一些了 如果有新的文章会继续补充 基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 基于LLMs的多模态大模型 Flamingo BLIP 2 KOSMOS 1 基于LLMs的
深度学习
多媒体和多模态
人工智能
预训练
大模型