科技，让二次元老婆动起来

2023-11-09

想让你的二次元老婆动起来吗？

前不久，Meta（也就是Facebook）发布了一款有趣的AI工具Animated Drawings，它可以让静态的儿童画动起来。

有些懂行的朋友一看就说“哎呀这不就是关键点检测再加动态化嘛”。

道理是这个道理，但是儿童画的特点是简单而又五花八门，能适配这种画作可不是容易的事情。

由于我的画功也不比小朋友强多少，下面就用我即兴发挥的一副大作来做个测试吧。

1 上传图片

首先，准备你的大作，在干净的纸上画一个角色，人类或者动物都可以，点击upload上传。

然后点击Next进入下一步。

2 裁剪图片

Animated Drawings会自动帮你裁剪图片到刚好覆盖你的角色，你也可以自己拖动裁剪，尽量减少无用的部分。

裁剪后点击Next进入下一步。

3 选择角色范围

这一步很像PS中的蒙版，我们需要把你的角色的具体部分进行高亮表示，这是因为有些小朋友画的确实过于离奇，导致没有识别出正常的四肢。

我这一幅画比较标准，所以自动识别效果已经很好了，不需要做什么改动了。

4 调整关键点

这是关键的一步，模型会检测你的角色中的关键点。

所谓关键点，就是比如你的五官、肘关节、膝关节、手脚等关键节点。想象你小时候玩的机器人，不就是通过活动这些部分让它“动起来”嘛，这里也是一样的。

5 让我们动起来吧！

现在我们就可以看到结果了！

这里展示一下兔子先生动起来的样子。

实际上，你用真人照片或者喜欢的二次元角色效果也是一样的，这不就可以让你的二次元老婆动起来了嘛，可见，科技让我们的生活更好！（不是

快来试试吧！官网链接是https://sketch.metademolab.com/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能

scratch

人脸识别

ui

OCR

科技，让二次元老婆动起来的相关文章

基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建
字符识别（OCR算法）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在开发一个项目其中我必须开发 OCR 算法我必须从图像中读取文本然后将其转换为不同的语言所以我的第一个任务是从图像中获取文
用于 OCR 的 Python OpenCV 倾斜校正

目前我正在开发一个 OCR 项目需要读取标签上的文本请参见下面的示例图片我遇到了图像倾斜的问题我需要帮助修复图像倾斜以便文本是水平的而不是成角度的目前我正在使用的过程尝试从给定范围下面包含代码对不同角度进行评分但这种方
训练 tesseract 后，tessdata 文件夹中应包含哪些文件？

我使用 tesseract 作为我的 ANPR 应用程序的 OCR 引擎我已经用车牌字体训练了 tesseract 3 01v 但我需要知道 tessdata 文件夹中应包含哪些文件我应该使用安装 tesseract 3 01v 的同一
为什么用 PIL 和 pytesseract 无法获取字符串？

这是一个简单的Python 3光学字符识别 OCR 程序来获取字符串我已经在这里上传了目标gif文件请下载并另存为 tmp target gif try from PIL import Image except ImportError
神经网络特征提取

我正在使用神经网络进行字母和数字的简单识别到目前为止我使用字母图像的每个像素作为网络的输入不用说这种方法产生的网络非常大所以我想从图像中提取特征并将它们用作神经网络的输入我的第一个问题是字母的哪些属性有利于识别它们第二个问题是
Tesseract OCR Android tessdata 目录未找到

我目前正在使用 OCR 开发 Android 应用程序并且已经达到了调用 BaseAPI init 方法的程度我不断收到错误消息指出该目录必须包含 tessdata 作为子文件夹我已检查文件目录是否包含其中包含训练数据文件的文件夹
Android 中最好的 OCR（光学字符识别）示例 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想要一个在android中运行OCR的例子我做了一些研究并找到了一个在android中实现OCR的例子 https github co
OCR：图像转文本？

在标记为复制或重复问题之前请先阅读整个问题我目前能做的如下获取图像并裁剪 OCR 所需的部分使用处理图像tesseract and leptonica 当应用的文档被裁剪成块即每个图像 1 个字符时它提供 96 的准确度如果
Microsoft Azure 认知服务手写检测边界框参数

我目前正在使用Microsoft Azure 认知服务手写检测 API https learn microsoft com en in azure cognitive services computer vision quickstarts
使用 OCR 识别上标字符

我已经开始了一个简单的项目其中它必须获取包含带有上标的文本的图像然后通过使用 OCR 目前我使用的是 tesseract 它必须识别上标字符普通字符例如我们有一个化学方程式例如 Cl 但是当我使用超立方体识别它时它给出了 Cl
我自己的 Python OCR 程序

我还是一个初学者但我想写一个字符识别程序这个程序还没有准备好而且我编辑了很多所以评论可能不完全一致我将使用 8 个连通性来标记连通分量 from PIL import Image import numpy as np im Ima
使用 OpenCV 对 Tesseract OCR 进行图像预处理

我正在尝试开发一个应用程序它使用 Tesseract 来识别手机摄像头拍摄的文档中的文本我使用 OpenCV 来预处理图像以实现更好的识别应用高斯模糊和阈值方法进行二值化但结果非常糟糕 Here https s6 postimg c
pytesseract 错误 Windows 错误 [错误 2]

您好我正在尝试使用 python 库 pytesseract 从图像中提取文本请查找代码 from PIL import Image from pytesseract import image to string print image
如何将 Tesseract 导入 Angular2 (TypeScript)

我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中但是在使用时 import Tesseract from types tesseract js it s
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE
提高 pytesseract 从图像中正确识别文本的能力

我正在尝试使用读取验证码pytesseract模块大多数时候它都能提供准确的文本但并非总是如此这是读取图像操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名

随机推荐

数据结构笔记之链式栈的基本操作

include stdio h include stdlib h include io h include math h include time h define OK 1 define ERROR 0 define TRUE 1 def
VMWare安装

1 1 VMWare简介 VMWare是一个虚拟技术的合集它提供了众多的相关软件类似于Parallels VMWare是商业应用而且价格非常的贵所以通常我们使用的是网上别人破解的版本而不是使用官方的正版 VMWare官网 VMw
【UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 0: invalid continuation byte】

UnicodeDecodeError utf 8 codec can t decode byte 0xd3 in position 0 invalid continuation byte F jupyter work dir MMLAB m
有一个公网IP，在内网如何架设多台服务器?

进行内网ip到外网ip的映射也就是pat 这个工作现在多半由防火墙来完成不过如果没有防火墙用路由器也可以完成只不过会在高峰时加重路由器的负担思科2600路由可以独立完成各种nat pat但是因为这款产品本身属于低端产品所以能够担
Java8学习记录(一)——Lambda表达式

这两天看了 Java8实战做一下记录目录一行为参数化 1 什么是行为参数化二函数式接口 1 概念三 Lambda表达式四方法引用注意点 1 静态方法引用 2 实例方法引用重点来了任意类型的实例方法引用现有对象的实例
【深度学习】树莓派Zero w深度学习模型Python推理

在机器学习开发过程中当模型训练好后接下来就要进行模型推理了根据部署环境可分为三类场景边缘计算一般指手机嵌入式设备直接在数据生成的设备上进行推理因为能避免将采集到的数据上传到云端所以实时性非常好端计算介于云和边缘设备之间
Spring Boot 集成Mybatis实现多数据源

总体来说多数据源配置有两种方式一种是静态的一种是动态的静态的方式我们以两套配置方式为例在项目中有两套配置文件两套mapper 两套SqlSessionFactory 各自处理各自的业务这个两套mapper都可以进行增删改查的操
GPU版本安装Pytorch教程最新方法

目录步骤第一步安装 Anaconda 和 Pycharm 软件第二步下载安装CUDA11 3 1 首先查看自己电脑GPU版本方式一搜索框输入nvidia 打开nvidia控制面板方式二 win R打开cmd 输入nvidia
ubuntu的FTP服务器搭建

1 安装服务器 sudo apt get install vsftpd 如果有错误先执行 apt update 2 创建用户 Linux下的用户创建专用目录 mkdir home ftp 命令添加ftp用户 sudo useradd d
基于tiny6410的led驱动程序

今天弄了一个晚上了终于弄懂了第一个简单的linux驱动感觉很多人编写的第一个驱动也是拿led开刀的吧本文的led驱动是基于tiny6410的四个led驱动用字符设备的驱动模块而不是混杂设备驱动模块来编写本人在使用混杂设备方法编写的
5735. 雪糕的最大数量

夏日炎炎小男孩 Tony 想买一些雪糕消消暑商店中新到 n 支雪糕用长度为 n 的数组 costs 表示雪糕的定价其中 costs i 表示第 i 支雪糕的现金价格 Tony 一共有 coins 现金可以用于消费他想要买尽可能多的
pyspark指定schema

通过StructType对象指定DataFrame的Schema 没有嵌套结构的json jsonString id 01001 city AGAWAM pop 15338 state MA id 01002 city CUSHMAN po
r语言 col_co，cob，col，con，cor，cog前缀其实都是com变化而已

c开头前缀有co cob col com con cor cog等哪它们有什么关联呢下面我们来分析 come 英 k m 美 k m v 来来到到达 com前缀可以看成come变化而成全部来到就是聚集到一起表聚集加强强调的
select函数使用浅析

一函数原型及参数说明 int select int maxfdp fd set readfds fd set writefds fd set errorfds struct timeval timeout 返回值负值 select错误
VIM-Plug安装插件时，频繁更新失败，或报端口443被拒绝

安装vim插件 tabular时候一直报错尝试了网上大部分办法全部失败方法直接按照报错的内容自己手动操作错误如下图第一步去github检查插件的网址有没有问题直接复制网址浏览器搜索若长时间加载不上使用科学上网第二步若
重写equals方法

重写equals方法相信在每个人都有过重写过java的equals的方法的经历这篇博文就从以下几个方面说明重写equals方法的原由与君共进步一为什么要重写equals方法首先我们了解equals方法的作用是什么 java的官方
[论文笔记] GENDA: A Graph Embedded Network Based Detection Approach on encryption algorithm

GENDA A Graph Embedded Network Based Detection Approach on encryption algorithm of binary program JISA 2022 Xiao Li Scho
关闭apache-httpClient日志遇到的坑

log4j logger org OFF log4j logger httpclient OFF 看org apache commons httpclient Wire源码才知道他没有遵循类名 httpclient wire public
requests、aiohttp、httpx性能大比拼

在Python中有许多用于发送HTTP请求的库其中最受欢迎的是requests aiohttp和httpx 这三个库的性能和功能各不相同因此在选择使用哪个库时需要考虑到自己的需求和应用场景首先让我们来了解一下这三个库的基本介绍
科技，让二次元老婆动起来

想让你的二次元老婆动起来吗前不久 Meta 也就是Facebook 发布了一款有趣的AI工具Animated Drawings 它可以让静态的儿童画动起来有些懂行的朋友一看就说哎呀这不就是关键点检测再加动态化嘛道理是这个道理但是儿

科技，让二次元老婆动起来

科技，让二次元老婆动起来 的相关文章

随机推荐

热门标签

科技，让二次元老婆动起来的相关文章