最近大火的两大AI绘图工具 Midjourney VS StableDiffusion

2023-11-17


大家好,今天给大家介绍一下最近大火的两大AI绘图工具,Midjourney (官网)和stable diffusion(官网)。


下面将分别从上手难易程度、出图效果 、出图效率、使用成本进行对比。


1、上手难易度


首先我们来看上手难易度。

Midjourney提供了一个友好的界面来帮助用户了解和操作每一步。它还提供了一个简单的模板,可以让用户快速开始并轻松创建和发布他们的消息。midjourney是基于discord搭建的绘画平台,先注册discord,用discord的账号可以直接登录midjourney,完成后即可进入Midjourney对应的对话框,通过输入不同的命令来调用不同功能。此外,Midjourney还允许用户使用现有的媒体,可以轻松地添加图片等。


在这里插入图片描述


进入之后,你可以看到midjourney的公共绘画区,很多人在这里生成图片,实时更新。


在这里插入图片描述


左侧栏里可以浏览频道,还有一些newbies-110,newbies-140这些是新手区,可以点进去生成自己的图片。


在这里插入图片描述

StableDiffusion,目前是开源的,也就是可以直接在本地部署,它需要用户深入了解技术知识,才能使用它来发布信息。它需要用户熟练掌握编码和数据库技术,才能完全利用它的所有功能。此外,StableDiffusion要求用户自己导入图像,视频等媒体,而不像Midjourney那样提供现成的媒体。当然对于硬件也是有要求的,基本要3g以上显卡显存至少要8gb。同时StableDiffusion模型占据的硬盘也比较多,至少有20-30G空间。当然也可以通过云部署的方式,比如通过Google的clap来部署StableDiffusion,即可通过url进行访问并使用。当然,想要得到更加丰富多彩的图片效果,还需结合不同的模型loray等。


StableDiffusion 大模型的切换,首先是这个界面左上角,在这里可以切换你所安装的模型。


在这里插入图片描述


文生图 ,这里与 Midjourney 不同的是,StableDiffusion 有一个反向关键词(意思是不要图片出现什么),文生图的关键词格式与 Midjourney 基本一致。


在这里插入图片描述

下面这块参数就是设置图片的一些基本参数,分辨率、尺寸等等,具体参数见下文


在这里插入图片描述

图生图,这个也很好理解,放参考图然后输入提示词,与其他 AI 绘画软件一致。

在这里插入图片描述


图片信息,意思是你用 SD 画的图,放在这里来,右边会显示这个图片的一些参数,包括关键词。


在这里插入图片描述


综合来讲,从上手难易度来说,Midjourney 更容易上手,StableDiffusion 稍难于上手!


2、两大ai绘图工具的出图效果

Midjourney 的底层原理是基于生成对抗网络和深度学习技术,当然我们还是更关注它的出图效果。我们可以看到Midjourney生成的图片都比较精美,目前版本已经升级到v5,真人生成会更加真实,细节处理的也比较到位。但是手指的处理上还是会出现瑕疵,Midjourney生成图片的可控性并不强,需要不断调整prompt,所以这也是目前最大的瓶颈。


例如,想要输入:可爱的女孩,手捧鲜花,背景是情人节活动气球装饰,用在线翻译帮忙翻译成英文关键词,输入:Lovely girl, holding flowers, with Valentine’s Day balloons in the background

机器人会在一分钟之内生成4张图片:


在这里插入图片描述


而StableDiffusion 用ldm潜在扩散模型,其目标是消除高斯噪声在训练图像上的连续应用,可以将其视为一系列去噪自动编码器。stable diffusion结合不同的模型,lauray可以生成各种不同风格的图片,通过正向提示词和反向提示词,可以更好的生成想要的图片。stable diffusion不仅仅具备纹身图、图声图、图、声纹这些功能,其嵌入的control net解决了空间一致性问题。以前根本没有有效的方法来告诉ai模型要保留输入图像的哪些部分control net。通过引入一种方法来改变这一点是StableDiffusion,能够使用额外的输入条件来告诉模型确切的做什么,甚至引入三dopen pose,生成人物的姿势或者动作,来精准控制需要生成的图片。这个是目前在a i绘图方面得到较高认可的功能。


例如:油画

prompt: portrait of bob barker playing twister with scarlett johansson, an oil painting by ross tran and thomas kincade


在这里插入图片描述

比如,这样的赛博朋克风

prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream


在这里插入图片描述


从出图效果看,StableDiffusion在可控性和应用广度上都略胜一筹。


3、出图效率

StableDiffusion 有一个弊端,就是速度非常慢,动辄半个小时起步。

Midjourney是Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室,Midjourney 对 Disco Diffusion 进行了改进,平均1分钟能出图。


4、ai绘图工具的使用成本

(1)、midoriy 如果你第一次在输入框里输入关键词时,弹出的是下面这样的提示。

在这里插入图片描述


说明免费用户没资格生成图片,需要去付费,以前的版本是说新用户有25张图片免费生成机会,但其实每输入一次关键词、点击一次放大、微调都算一次,所以25次免费机会很快就用完了,如果还想继续使用,还是需要购买会员。


现在的版本似乎没有新用户免费试用额度了, 已经关闭了免费使用权限,必须订阅才能使用。


目前可以年年和月月付分为三档,basic plan, standard plane plan主要是在出图数量、快速模式时间快速出图模式和并行数有所区别。


在这里插入图片描述


在这里插入图片描述


(2)、StableDiffusion

StableDiffusion虽然是开源的,可以在本地运行,但是对硬件要求较高。如果不考虑入手硬件的小伙伴,也可以考虑购买类似google collab p的云服务进行部署。我们以google clap为例,有coo lab pro、co lab pro加两种订阅方案。这两个在计算单元上有所区别。同时,collab pro加还支持后台执行,最后还有psugo方案,可以购买更多的计算单元,从使用成本看因人而异。如果只是想生成一些图片,两者都可,成本也相差无几。如果是想长期使用ai绘图工具辅助完成一些工作,我会建议入手一款配置高点的显卡,在本地部署stable defence。从长期投入来看,成本是最低的一种方案。


(3)、成本对比图


在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

最近大火的两大AI绘图工具 Midjourney VS StableDiffusion 的相关文章

随机推荐

  • Google hacking了解

    google hacking方法技术手册 1 黄金法则 不区分大小写 通配符只表示词组中一个词 32个单词限制 关键字 双引号强制搜索包含关键字内容 intext password username userid xxx 1 利用搜索引擎进
  • 【测试】利用LoadComplete确定不同负载下的服务器性能

    LoadComplete是一个负载测试工具 用于为Web服务器和服务创建和运行自动负载测试 它可以在手机 网站和web应用程序上设计和运行性能 压力和负载测试 您不需要有编程知识 创建一个负载测试只需要几秒钟的时间 接下来我们通过LoadC
  • ELK系列(二)、在Kibana中使用RESTful操作ES库

    上一篇讲了如何安装ELK ELK系列 一 安装ElasticSearch Logstash Kibana Filebeat v7 7 0 这篇介绍如何使用kibana连接ES并操作 先介绍一下ES和关系型数据库的概念对应 在ES7以前的版本
  • 字典树p8036

    Description 给定 n 个模式串 1 2 s1 s2 sn 和 q 次询问 每次询问给定一个文本串 ti 请回答 1 s1 sn 中有多少个字符串 sj 满足 ti 是 sj 的前缀 一个字符串 t 是 s 的前缀当且仅当从 s
  • Windows下MySQL的详细安装教程

    1 安装之前需要注意的几点 建议不要安装最新版本 一般找mysql5 0系列版本即可 mysq1官网有 zip和 msi两种安装形式 zip是压缩包 直接解压缩以后使用的 需要自己配置各种东西 msi是安装包 系统直接帮我们安装搞定 新手建
  • (c)面向过程与(c++)面向对象有什么区别

    相信大家都有一定的了解 c语言是一个面向过程的语言 而c 是一个面向对象的语言 那么面向对象和面向过程有什么区别呢 各举一个例子吧 C面向过程 gt 从面向过程的方向考虑就像我要开车我就要先开门 系安全带 打火 松手刹 挂挡 起步 我们关心
  • 二、Linux网络编程:Socket编程-接口

    2 Socket编程 接口 2 1 接口转换 转接口的换操作主要分为三类 字节序转换操作 IP地址转换操作和主机名转换操作 2 1 1 字节序转换操作 网络序转主机序 函数 含义 作用 ntohs network to host short
  • service启动失败问题排查

    本文首发在我的个人博客 https jlice top p 7ve9p 欢迎大家前去参观 么么哒 我的电脑在启动时总会提示 Failed to start Load Kernel Modules 虽然不影响使用 可强迫症看了还是会觉得难受
  • java jdbc 保存,​高级进阶 JDBC 保存和导出文本文件

    1 创建一个 表 textfile create table textfile id int primary key auto increment content longtext 2 向 表 textfile的 content 字段中保存
  • Java中String中的substring()方法的使用

    Substring 1 public String substring int index 使用此方法目的在于返回一个新的字符串 它是此字符串的一个子字符串 该子字符串始于指定索引处的字符 一直到此字符串末尾 下面举两个例子说明 schlo
  • 身材不高穿什么身材不高穿什么

    穿衣TIPS 个子小又丰满的女孩 选择短裙是对的 特别是亮色的短裙 可以把人的视线往上提 增加高度感 穿衣TIPS 小个子的MM们在挑选衣服的时候 最重要的就是要先确定自己的风格 如果你确实比较丰满 那么就干脆学曾宝仪走可爱路线吧 选择一些
  • 【QPalette】调色板简介

    描述 QPalette类包含每个小部件状态的颜色组 调色板由三个颜色组组成 活动的 禁用的和非活动的 Qt中的所有小部件都包含一个调色板 并使用它们的调色板来绘制自己 这使得用户界面易于配置和保持一致 如果您创建一个新的小部件 我们强烈建议
  • c语言常见练习题

    计算一个程序的运行时间 include
  • Centos系统安装Nodejs

    1 软件下载 官方网站 https nodejs org en 1 新版本下载说明 新版本可以在home页面直接下载 也可以在DOWNLOADS页面下载 2 旧版本下载说明 进入 DOWNLOADS 页面 页面滑动到最下面 点击左侧 Pre
  • PHP+jQuery+jCrop在线上传裁剪头像(内含源码)

    源码里面使用到两个开源的jQuery插件 其一是Ajax上传用的是uploadify 这个上传插件比较牛逼 并且可以自定义的东西也比较多 demo里面我用的不完善 没有把项目里面用到的取消上传和删除功能加上 同样也可以使用其他不需要使用Fl
  • 华为OD机试真题 Java 实现【矩阵稀疏扫描】【2023 B卷 100分】,附详细解题思路

    一 题目描述 如果矩阵中的许多系数都为零 那么该矩阵就是稀疏的 对稀疏现象有兴趣是因为它的开发可以带来巨大的计算节省 并且在许多大的实践中都会出现矩阵稀疏的问题 给定一个矩阵 现在需要逐行和逐列地扫描矩阵 如果某一行或者某一列内 存在连续出
  • unity 获得当前物体_Unity3D获取当前键盘按键及Unity3D鼠标、键盘的基本操作

    获取当前键盘按键 代码如下 using UnityEngine using System Collections public class GetCurrentKey MonoBehaviour KeyCode currentKey voi
  • 解决draw.io生成SVG矢量图导入Word显示有误的问题以及推荐几种SVG绘图方法

    解决draw io生成SVG矢量图导入Word显示有误的问题以及推荐几种SVG绘图方法 起因 解决办法 操作步骤 修改后效果 关于Word加载项draw io工具 流程图等推荐用Xmind 图表数据等也可以用Python的matplotli
  • centos7 基础命令

    一 linux基础 1 查看服务器的IP信息 ip add showifconfig 2 操作网卡命令 重启网络和启用网卡 systemctl restart networksystemctl start networksystemctl
  • 最近大火的两大AI绘图工具 Midjourney VS StableDiffusion

    大家好 今天给大家介绍一下最近大火的两大AI绘图工具 Midjourney 官网 和stable diffusion 官网 下面将分别从上手难易程度 出图效果 出图效率 使用成本进行对比 1 上手难易度 首先我们来看上手难易度 Midjou