将视频字幕与文本转语音同步

2024-02-29

我尝试创建一个文本视频，其中的文本通过文本转语音进行叙述。

为了创建视频文件，我使用VideoFileWriter of Aforge.Net如下：

VideoWriter = new VideoFileWriter();

VideoWriter.Open(CurVideoFile, (int)(Properties.Settings.Default.VideoWidth),
    (int)(Properties.Settings.Default.VideoHeight), 25, VideoCodec.MPEG4, 800000);

大声朗读我使用的文字SpeechSynthesizer类并将输出写入波形流

AudioStream = new FileStream(CurAudioFile, FileMode.Create);
synth.SetOutputToWaveStream(AudioStream);

我想突出显示视频中所说的单词，所以我通过SpeakProgress event:

void synth_SpeakProgress(object sender, SpeakProgressEventArgs e)
{

    curAuidoPosition = e.AudioPosition;
    using (Graphics g = Graphics.FromImage(Screen))
    {
         g.DrawString(e.Text,....); 
    }                    
    VideoWriter.WriteVideoFrame(Screen, curAuidoPosition);
}

最后，我使用合并视频和音频ffmpeg

using (Process process = new Process())
{
        process.StartInfo.FileName = exe_path;
        process.StartInfo.Arguments = 
            string.Format(@"-i ""{0}"" -i ""{1}"" -y -acodec copy -vcodec copy ""{2}""", avi_path, mp3_path, output_file);

        // ...
}

问题是，对于 Microsoft Hazel、Zira 和 David 等某些声音，在 Windows 8.1 中，视频与音频不同步，并且音频比显示的字幕快得多。然而，对于 Windows 7 中的声音来说，它是有效的。

如何同步它们，以便它适用于任何操作系统上的任何文本转语音？

看来e.AudioPosition是不准确的，因为它被提到SpeechSynthesizer 的 SpeakProgressEventArgs 是否不准确？ https://stackoverflow.com/q/1718967/2651073，我做了同样的实验，得到了同样的结果。

我注意到如果调整音频格式，我可以接近实际时间，但它不适用于任何声音。

var formats = CurVoice.VoiceInfo.SupportedAudioFormats;
if (formats.Count > 0)
{
    var format = formats[0];
    reader.SetOutputToWaveFile(CurAudioFile, format);
}
else
{
     AudioStream = new FileStream(CurAudioFile, FileMode.Create);
     reader.SelectVoice(CurVoice.VoiceInfo.Name);
    var fmt = new SpeechAudioFormatInfo(16000, AudioBitsPerSample.Sixteen, AudioChannel.Mono);
    // this is more close but not precise yet
    MemStream = new MemoryStream();
    var mi = reader.GetType().GetMethod("SetOutputStream", BindingFlags.Instance | BindingFlags.NonPublic);
    mi.Invoke(reader, new object[] { MemStream, fmt, true, true }); 
 }

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Audio

aforge

speechSynthesis

speechsynthesizer

将视频字幕与文本转语音同步的相关文章

尚未注册类型“IServiceProviderFactory[Autofac.ContainerBuilder]”的服务

当运行以下命令添加数据库迁移脚本时出现以下错误 dotnet ef migrations add InitialCreate v o Migrations context MyContext 访问 Microsoft Extensions
使用 mono/nunit-console/4 在 Mac OS X 控制台上运行测试

我安装了 Max OS X 10 11 1 上面装有 Xamarin 我编写了简单的测试类只是为了测试在 Mac OS X 和 Ubuntu 上运行 Nunit 测试该类实际上有一个返回字符串的方法 using System names
在实体框架拦截器中向 DbScanExpression 添加内部联接

我正在尝试使用实体框架 CommandTree 拦截器通过 DbContext 向每个查询添加过滤器为了简单起见我有两个表一个称为 User 有两列 UserId 和 EmailAddress 另一个称为 TenantUser 有两列
更改 Qt OpenGL 窗口示例以使用 OpenGL 3.3

我正在尝试更改 Qt OpenGL 示例以使用更现代的 opengl 版本 330 似乎合适所以我做了在 main cpp 上设置版本和配置文件设置着色器版本更改着色器以使用统一它现在构建没有任何错误但我只看到一个空白窗口我错
如何在 C# / .NET 中创建内存泄漏[重复]

这个问题在这里已经有答案了可能的重复托管代码中是否可能存在内存泄漏特别是 C 3 0 https stackoverflow com questions 6436620 is it possible to have a memory
平滑滚动.net 表单

您好我正在 net 中使用表单并且在运行时动态添加大量链接标签我将这些链接标签添加到面板并将该面板添加到 winform 当链接标签的数量增加时表单会显示一个自动滚动条垂直现在当我使用自动滚动向下滚动时表单在滚动时不会更新其
ASP.NET Web API 客户端 ProgressMessageHandler Post 任务卡在 WinForm 应用程序中

我在用着HttpClient and ProgressMessageHandler来自MS ASP NET Web API 客户端库 http nuget org packages Microsoft AspNet WebApi Clien
找不到 assimp-vc140-mt.dll ASSIMP

我已经从以下位置下载了 Assimp 项目http assimp sourceforge net main downloads html http assimp sourceforge net main downloads html Ass
如何在 C# 控制台应用程序中将修饰符（ctrl、alt、shift）按键捕获为单个按键？

Console ReadKey 仅在按下正常键时捕获输入然后将修饰符如果有附加为键信息的一部分如何将单个修饰键注册为输入提供了一种解决方案这个链接 https blogs msdn microsoft com toub 200
如何在 QTabWidget Qt 中展开选项卡

我有一个QTabWidget像这个但我想展开选项卡以填充整个小部件宽度如下所示我怎样才能做到这一点我在用Qt 5 3 2 and Qt 创建者 3 2 1 Update 我尝试使用setExpanding功能 ui gt myT
在 JSQMessagesViewController 中显示 LocationMediaItem

我刚刚尝试实施LocationMediaItem in my Xamarin iOS应用程序使用JSQMessagesViewController 一切都很顺利唯一的问题是UICollectionView应该显示位置的单元格永远停留在加载
Visual Studio Code：如何配置 includePath 以获得更好的 IntelliSense 结果

我是使用 Visual Studio Code 的完全初学者我不知道我在做什么我已经四处搜索也许还不够但我找不到像我这样的人如何配置的简单解释c cpp properties json每当我单击带有绿色波浪线下划线的行旁边的黄色灯泡
AES 输出是否小于输入？

我想加密一个字符串并将其嵌入到 URL 中因此我想确保加密的输出不大于输入 AES 是可行的方法吗不可能创建任何始终会创建比输入更小的输出的算法但可以将任何输出反转回输入如果您允许不大于输入那么基本上您只是在谈论同构算法alwa
运行选定的代码生成器时出错：“未将对象引用设置到对象的实例。”错误？

我已经尝试了所有解决方案例如修复 VS 2013 但没有用当您通过右键单击控制器文件夹来创建控制器并添加控制器时然后右键单击新创建的控制器的操作并选择添加视图当我尝试创建视图时就会发生这种情况它不是一个新项目而是一个现有项目
cout 和字符串连接

我刚刚复习了我的 C 我尝试这样做 include
您是否将信息添加到每个 .hpp/.cpp 文件的顶部？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案创建新的 C 头文件源文件时您会在顶部添加哪些信息例如您是否添加日期您的姓名文件描述等您是否使用结构化格式来存储此信息 e g F
矩阵到数组 C#

这将是转换方阵的最有效方法例如 1 2 3 4 5 6 7 8 9 into 1 2 3 4 5 6 7 8 9 in c 我在做 int array2D new int 1 2 3 4 5 6 7 8 9 int array1D new
在简单注入器中解析具有自定义参数的类

我正在使用以下命令创建 WPF MVVM 应用程序简易注射器作为 DI 容器现在当我尝试从简单注入器解析视图时遇到一些问题因为我需要在构造时将参数传递到构造函数中而不是在将视图注册到容器时因此这不是适用的简单注入器将值传递到构造
xsi:type 属性搞乱了 C# XML 反序列化

我使用 XSD exe 根据 XML 架构 xsd 文件自动生成 C 对象我正在反序列化 OpenCover 输出但其中一个部分类未正确生成这是导致异常的行
从 JavaScript 中的 OnClientClick 事件中阻止 C# 中的 asp:Button OnClick 事件？

我有一个asp Button在我的网页上它调用 JavaScript 函数和代码隐藏方法后者进行调用以导航到另一个页面在 JavaScript 函数中我正在检查条件如果不满足这个条件我想中止导航以便OnClick方法未被调用

随机推荐

致命错误：在非对象 codeigniter $query->num_rows()==1) 上调用成员函数 where() [重复]

这个问题在这里已经有答案了可能的重复 CodeIgniter 在非对象上调用成员函数 select https stackoverflow com questions 8322124 codeigniter call to a membe
在 CQRS http 应用程序中实现 Saga/Process Manager

按照这个例子 https msdn microsoft com en us library jj591569 aspx https msdn microsoft com en us library jj591569 aspx 图3 它如何适
ofstream 无法在 Linux 上运行

我有一个简单的测试代码 include
递归排列列表

我想通过递归来解决问题我有一个给定的字母列表我想要这些字母的所有排列直到达到给定的长度 var letters A B C D E F function myRekursion alphabet n if n gt 0 for var
高效利用Android资源

我试图弄清楚如何有效地使用 Android 的资源系统既提供最高分辨率的资源又保持较小的 apk 大小我的资源文件夹 drawable normal mdpi drawable normal hdpi drawable large m
使用 OpenMP 在两个内核上设置线程关联

我使用的是C程序在Windows7上用gcc 4 9 2编译使用OpenMP 4 0 我的电脑是双核四个线程我想使用线程亲和力传播并使用放置在不同核心上的 2 个线程因此当我从 DOS 设置环境变量时设置 OMP NUM TH
Xamarin-Android 和 UWP 之间的蓝牙连接

在相当多的时间里我一直在努力寻找一个可行的解决方案来通过 IP 连接或蓝牙连接 Android 设备和 UWP 应用程序在 PC 上主要问题是找到一组足够简单但又保证可以工作的代码或示例这样我的努力就不会白费这种情况已经持续了一个
为什么要加密用户密码？ [复制]

这个问题在这里已经有答案了可能的重复为什么不存储原始密码 https stackoverflow com questions 3107810 why arent original passwords stored 如果密码是数据中最不有
Laravel 设置无法打开流

我正在尝试设置 laravel 但事实证明它是正确的我从 github 克隆了它还使用 Composer 克隆了 Laravel 这两种技术都可以工作这很好因为它是我真正想学习的东西比我想象的简单然而当我尝试导航到名为 iPr
Rowset不支持向后滚动

我正在尝试使用以下代码查询 MySQL 数据库 declare the variables Dim Connection Dim Recordset Dim SQL declare the SQL statement that will q
读取分区镶木地板时，Spark 错误地将以“d”或“f”结尾的分区名称解释为数字

我在用着spark read parquet 从分区中组织镶木地板文件的文件夹中读取当分区名称以以下结尾时结果将是错误的f or d 显然 Spark 会将它们解释为数字而不是字符串我创建了一个最小的测试用例如下所示来重现该问题 d
无法在 eclipse 中安装 blackberry webworks 插件

using http www blackberry com go eclipseUpdate 3 6 java http www blackberry com go eclipseUpdate 3 6 java 我安装了Blackberry
Python TypeVar 中输出变量和第一个参数之间的区别

我正在查看 Python TypeVar 的文档但无法弄清楚第一个参数或者可能是赋值变量的含义从 3 8 文档 A TypeVar A str bytes Must be str or bytes def longest x A y
pyautogui，屏幕截图功能无法识别已安装的 Pillow 模块

我想在Pycharm中执行这段代码 x y pyautogui locateCenterOnScreen LVL35 png 但我收到这条消息 ImportError Pillow module must be installed to u
如何在android布局中创建固定页脚？

我正在使用以下代码在活动底部显示按钮
如何将程序限制为单个实例

我有一个 C 控制台应用程序我想限制我的应用程序一次仅运行一个实例我如何在 C 中实现这一目标我会用一个Mutex http msdn microsoft com en us library system threading mute
引导 gem5 X86 Ubuntu 完整系统模拟

我需要在 gem5 上运行相对较新版本的 x86 磁盘映像从开始本指南 http www lowepower com jason creating disk images for gem5 html我使用了带有 Kernel v3 2
实施到我的应用程序的深层链接后，应用程序图标不出现

我正在 Android Studio 中开发一个应用程序它运行得很好但是在实现了到我的启动活动的深层链接后我的应用程序没有出现在菜单中的应用程序图标我知道该应用程序已安装因为它出现在设置 gt 应用程序中我知道问题出在man
如何将 python 字符串转换为 ucs2 十六进制？

我一直在寻找这个但找不到尽管它看起来很简单我需要在 url 中发送 ucs2 十六进制字符串但我不知道如何将 python 字符串转换为 ucs2 十六进制有什么想法吗 gt gt gt encode utf16 b xff xf
将视频字幕与文本转语音同步

我尝试创建一个文本视频其中的文本通过文本转语音进行叙述为了创建视频文件我使用VideoFileWriter of Aforge Net如下 VideoWriter new VideoFileWriter VideoWriter Ope

将视频字幕与文本转语音同步

将视频字幕与文本转语音同步 的相关文章

随机推荐

热门标签

将视频字幕与文本转语音同步的相关文章