AI数字人技术

AI数字人：基于VITS-fast-fine-tuning构建多speaker语音训练

1 VITS模型介绍 VITS Variational Inference with adversarial learning for end to end Text to Speech 是一种语音合成方法它使用预先训练好的语音编码器 v

AI数字人技术 人工智能

1 Wav2Lip HD项目介绍数字人打造中语音驱动人脸和超分辨率重建两种必备的模型它们被用于实现数字人的语音和图像方面的功能通过Wav2Lip HD项目可以快速使用这两种模型完成高清数字人形象的打造项目代码地址 github地址

AI数字人技术 人工智能 超分辨率重建 图像处理 深度学习

1 whisper介绍拥有ChatGPT语言模型的OpenAI公司开源了 Whisper 自动语音识别系统 OpenAI 强调 Whisper 的语音识别能力已达到人类水准 Whisper是一个通用的语音识别模型它使用了大量的多语言和

AI数字人技术 Whisper 语音识别 深度学习 Pytorch