Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
解决ChatGML启动报错:RuntimeError: expected scalar type Half but found Float
1 编辑web demo2 py文件 2 在原始命令加上 half 原始命令 model AutoModel from pretrained app model chatglm2 6b trust remote code True half
大模型
人工智能
chatGML
drag diffusion中的gradio代码逐行解析
gradio库是一个用于创建简单web应用程序的库 允许用户通过浏览器和程序进行交互 1 gr Blocks 使用with创建 在with中创建的任何组件都会自动添加到应用程序中 组件按创建顺序垂直显示在应用中 Blocks 模块用于组件在
大模型
人工智能
基于开源大模型Vicuna-13B构建私有制库问答系统
本教程专注在怎么使用已经开源的模型和项目 构建一个可以私有化部署的问答知识库 而且整体效果要有所保障 主要工作包括 选择基础模型 openAI claude 这些商用的 或者其他的开源的 这次我们选择 Vicuna 13B 开源有很多的知识
gpt
私有知识库
问答系统
大模型
私有部署、重构企业软件,第四范式发布大模型“式说”
大模型领域再添重要一员 4月26日 第四范式首次向公众展示其大模型产品 式说3 0 并首次提出AIGS战略 AI Generated Software 以生成式AI重构企业软件 式说将定位为基于多模态大模型的新型开发平台 提升企业软件的体验
AI
人工智能
深度学习
第四范式
大模型
碎片笔记
前言 与传统的AI攻防 后门攻击 对抗样本 投毒攻击等 不同 如今的大模型攻防涉及以下多个方面的内容 目录 一 大模型的可信问题 1 1 虚假内容生成 1 2 隐私泄露 二 大模型的安全问题 2 1 模型窃取攻击 2 2 数据窃取攻击 2
碎片笔记
笔记
人工智能
大模型攻防
大模型
因材施教,有道发布“子曰”教育大模型,落地虚拟人口语教练等六大应用
因材施教的教育宗旨下 大模型浪潮中 网易有道凭借其对教育场景的深入理解和对商业化的理性思考 为行业树立了垂直大模型的典范 7月26日 教育科技公司网易有道举办了 powered by 子曰 教育大模型应用成果发布会 会上重磅推出了国内首个教
AI
AIGC
大模型
子曰大模型
网易有道
8月热门论文丨AI Agent会是大模型的未来发展方向吗?
过去的8月 如果让我用一个词来总结 那就是 Agent 大模型的下半场已经拉开序幕 大厂们都纷纷表态入局 Agent OpenAI创始成员Andrej Karpathy表示相比大模型 OpenAI内部目前已经关注Agent领域 亚马逊也宣布
人工智能
AI
Agent
LLM
大模型
Stable diffusion模型种类说明
1 基础模型 pruned是完整版模型 emaonly是剪枝版模型 如果想要训练自己的模型 需要下载完整的大模型 1 SD系列 sd v1 4 sd v1 5 sd v2之类的 都是stable diffusion自带的大模型 效果会比较差
大模型
stable diffusion
LLMs开源模型们的分布式训练和量化
前一篇博文整理了 LLMs开源模型们和数据集简介 这篇博文主要整理一下目前流行的训练方法和量化 图自Towards a Unified View of Parameter Efficient Transfer Learning Tuning
深度学习
开源
预训练
大模型
分布式
云孚科技受邀参加2023年大连数交会
2023年7月6日至9日 由商务部 科技部 中国贸促会和辽宁省政府共同主办的2023中国国际数字和软件服务交易会 简称 数交会 在辽宁大连举行 云孚科技受中关村软件园孵化器邀请 与其他23家数字与软件服务企业组成北京展团共同参加本届数交会大
人工智能
数交会
大模型
基于LLaMA-2进行微调的FreeWilly2开源语言模型
FreeWilly2是由Stability AI基于Llama2 70B所微调后发布的大语言模型 该模型的部分推理能力甚至已经超越了openAI的GPT 3 5 截止至发稿前 该模型在HuggingFace的开源语言模型排行榜中位列榜首 大
人工智能
语言模型
大模型
自然语言处理
LLaMA
【通览一百个大模型】Anthropic LLM(Anthropic)
通览一百个大模型 Anthropic LLM Anthropic 作者 王嘉宁 本文章内容为原创 仓库链接 https github com wjn1996 LLMs NLP Algo 订阅专栏 大模型 NLP 算法 可获得博主多年积累的全
GPT-4 剑指多模态,前有谷歌 PaLM-E,AI 格局要变?
本文首发自 HyperAI超神经微信公众号 美东时间 3 月 14 日 OpenAI 重磅推出大型多模态模型 GPT 4 GPT 4 是 ChatGPT 和 Bing AI 聊天机器人背后的技术基础 OpenAI 称 GPT 4 能接受图像
人工智能
大模型
落地领域大模型应知必会(2): 轻量化微调
编者按 在实际部署大模型的过程中可能会面临资源限制的问题 通过轻量化大模型微调技术 可以将大型预训练语言模型适配到特定领域 特定任务 并减小其模型尺寸和计算量需求 提高性能和效率 在上一篇文章中 我们分享了大语言模型的主要微调技术总览 接下
技术干货
深度学习
大模型
大模型微调
白海科技
LLMs的自动化工具系统(HuggingGPT、AutoGPT、WebGPT、WebCPM)
在前面两篇博文中已经粗略介绍了增强语言模型和Tool Learning 本篇文章看四篇代表性的自动化框架 HuggingGPT AutoGPT WebGPT WebCPM Augmented Language Models 增强语言模型 T
深度学习
python
人工智能
预训练
大模型
论文阅读_大模型_ToolLLM
英文名称 ToolLLM Facilitating Large Language Models to Master 16000 Real world APIs 中文名称 TOOLLLM 帮助大语言模型掌握16000多个真实世界的API 文章
大模型
论文阅读
星星之火:国产讯飞星火大模型的实际使用体验(与GPT对比)
AIGC技术内容创作征文 全网寻找AI创作者 快来释放你的创作潜能吧 文章目录 1 前言 2 测试详情 2 1 文案写作 2 2 知识写作 2 3 阅读理解 2 4 语意测试 重点关注 2 5 常识性测试 重点关注 2 6 代码理解与生成
蓝色是天的命题作文
gpt
讯飞星火
大模型
LLM
训练大模型时显存占用影响因素总结(以starcoderplus 15.5B为例)
背景 实验室计算资源紧张 单卡最大显存是RTX 3090 24G 但是又要用大模型 指参数量达到10B 做实验 模型文件获取 大约60B https huggingface co bigcode starcoderplus tree mai
提示工程
大模型
starcoder
ChatGLM2-6B! 我跑通啦!本地部署+微调(windows系统)
ChatGLM2 6B 我跑通啦 windows系统 1 跑通了啥 2 咋跑通的 2 1 ChatGLM2 6B本地部署 2 2 ChatGLM2 6B本地微调 2 3 小结 3 打算做什么 1 跑通了啥 记录一下此时此刻 2023年7月8
大模型
开源
Windows
人工智能
AIGC
哈工大团队开源医学智能问诊大模型
原文 CVHub 门头沟学院AI视觉实验室御用公众号 学术 科研 就业 185篇原创内容 公众号 Title HuaTuo Tuning LLaMA Model with Chinese Medical KnowledgePDF https
大模型
人工智能
LLaMA
ChatGPT
AIGC
«
1
2
3
4
5
6
»