大模型

解决ChatGML启动报错：RuntimeError: expected scalar type Half but found Float

1 编辑web demo2 py文件 2 在原始命令加上 half 原始命令 model AutoModel from pretrained app model chatglm2 6b trust remote code True half

大模型 人工智能 chatGML

drag diffusion中的gradio代码逐行解析

gradio库是一个用于创建简单web应用程序的库允许用户通过浏览器和程序进行交互 1 gr Blocks 使用with创建在with中创建的任何组件都会自动添加到应用程序中组件按创建顺序垂直显示在应用中 Blocks 模块用于组件在

大模型 人工智能

基于开源大模型Vicuna-13B构建私有制库问答系统

本教程专注在怎么使用已经开源的模型和项目构建一个可以私有化部署的问答知识库而且整体效果要有所保障主要工作包括选择基础模型 openAI claude 这些商用的或者其他的开源的这次我们选择 Vicuna 13B 开源有很多的知识

gpt 私有知识库 问答系统 大模型

私有部署、重构企业软件，第四范式发布大模型“式说”

大模型领域再添重要一员 4月26日第四范式首次向公众展示其大模型产品式说3 0 并首次提出AIGS战略 AI Generated Software 以生成式AI重构企业软件式说将定位为基于多模态大模型的新型开发平台提升企业软件的体验

AI 人工智能 深度学习 第四范式 大模型

碎片笔记

前言与传统的AI攻防后门攻击对抗样本投毒攻击等不同如今的大模型攻防涉及以下多个方面的内容目录一大模型的可信问题 1 1 虚假内容生成 1 2 隐私泄露二大模型的安全问题 2 1 模型窃取攻击 2 2 数据窃取攻击 2

碎片笔记 笔记 人工智能 大模型攻防 大模型

因材施教，有道发布“子曰”教育大模型，落地虚拟人口语教练等六大应用

因材施教的教育宗旨下大模型浪潮中网易有道凭借其对教育场景的深入理解和对商业化的理性思考为行业树立了垂直大模型的典范 7月26日教育科技公司网易有道举办了 powered by 子曰教育大模型应用成果发布会会上重磅推出了国内首个教

AI AIGC 大模型 子曰大模型 网易有道

8月热门论文丨AI Agent会是大模型的未来发展方向吗？

过去的8月如果让我用一个词来总结那就是 Agent 大模型的下半场已经拉开序幕大厂们都纷纷表态入局 Agent OpenAI创始成员Andrej Karpathy表示相比大模型 OpenAI内部目前已经关注Agent领域亚马逊也宣布

人工智能 AI Agent LLM 大模型

Stable diffusion模型种类说明

1 基础模型 pruned是完整版模型 emaonly是剪枝版模型如果想要训练自己的模型需要下载完整的大模型 1 SD系列 sd v1 4 sd v1 5 sd v2之类的都是stable diffusion自带的大模型效果会比较差

大模型 stable diffusion

LLMs开源模型们的分布式训练和量化

前一篇博文整理了 LLMs开源模型们和数据集简介这篇博文主要整理一下目前流行的训练方法和量化图自Towards a Unified View of Parameter Efficient Transfer Learning Tuning

深度学习 开源 预训练 大模型 分布式

云孚科技受邀参加2023年大连数交会

2023年7月6日至9日由商务部科技部中国贸促会和辽宁省政府共同主办的2023中国国际数字和软件服务交易会简称数交会在辽宁大连举行云孚科技受中关村软件园孵化器邀请与其他23家数字与软件服务企业组成北京展团共同参加本届数交会大

人工智能 数交会 大模型

基于LLaMA-2进行微调的FreeWilly2开源语言模型

FreeWilly2是由Stability AI基于Llama2 70B所微调后发布的大语言模型该模型的部分推理能力甚至已经超越了openAI的GPT 3 5 截止至发稿前该模型在HuggingFace的开源语言模型排行榜中位列榜首大

人工智能 语言模型 大模型 自然语言处理 LLaMA

【通览一百个大模型】Anthropic LLM（Anthropic）

通览一百个大模型 Anthropic LLM Anthropic 作者王嘉宁本文章内容为原创仓库链接 https github com wjn1996 LLMs NLP Algo 订阅专栏大模型 NLP 算法可获得博主多年积累的全

GPT-4 剑指多模态，前有谷歌 PaLM-E，AI 格局要变？

本文首发自 HyperAI超神经微信公众号美东时间 3 月 14 日 OpenAI 重磅推出大型多模态模型 GPT 4 GPT 4 是 ChatGPT 和 Bing AI 聊天机器人背后的技术基础 OpenAI 称 GPT 4 能接受图像

人工智能 大模型

落地领域大模型应知必会(2): 轻量化微调

编者按在实际部署大模型的过程中可能会面临资源限制的问题通过轻量化大模型微调技术可以将大型预训练语言模型适配到特定领域特定任务并减小其模型尺寸和计算量需求提高性能和效率在上一篇文章中我们分享了大语言模型的主要微调技术总览接下

技术干货 深度学习 大模型 大模型微调 白海科技

LLMs的自动化工具系统（HuggingGPT、AutoGPT、WebGPT、WebCPM）

在前面两篇博文中已经粗略介绍了增强语言模型和Tool Learning 本篇文章看四篇代表性的自动化框架 HuggingGPT AutoGPT WebGPT WebCPM Augmented Language Models 增强语言模型 T

深度学习 python 人工智能 预训练 大模型

论文阅读_大模型_ToolLLM

英文名称 ToolLLM Facilitating Large Language Models to Master 16000 Real world APIs 中文名称 TOOLLLM 帮助大语言模型掌握16000多个真实世界的API 文章

大模型 论文阅读

星星之火：国产讯飞星火大模型的实际使用体验（与GPT对比）

AIGC技术内容创作征文全网寻找AI创作者快来释放你的创作潜能吧文章目录 1 前言 2 测试详情 2 1 文案写作 2 2 知识写作 2 3 阅读理解 2 4 语意测试重点关注 2 5 常识性测试重点关注 2 6 代码理解与生成

蓝色是天的命题作文 gpt 讯飞星火 大模型 LLM

训练大模型时显存占用影响因素总结(以starcoderplus 15.5B为例)

背景实验室计算资源紧张单卡最大显存是RTX 3090 24G 但是又要用大模型指参数量达到10B 做实验模型文件获取大约60B https huggingface co bigcode starcoderplus tree mai

提示工程 大模型 starcoder

ChatGLM2-6B! 我跑通啦！本地部署+微调（windows系统）

ChatGLM2 6B 我跑通啦 windows系统 1 跑通了啥 2 咋跑通的 2 1 ChatGLM2 6B本地部署 2 2 ChatGLM2 6B本地微调 2 3 小结 3 打算做什么 1 跑通了啥记录一下此时此刻 2023年7月8

大模型 开源 Windows 人工智能 AIGC

哈工大团队开源医学智能问诊大模型

原文 CVHub 门头沟学院AI视觉实验室御用公众号学术科研就业 185篇原创内容公众号 Title HuaTuo Tuning LLaMA Model with Chinese Medical KnowledgePDF https

大模型 人工智能 LLaMA ChatGPT AIGC