将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

2024-02-28

我正在尝试从 TCP 套接字在 C# 中进行“流式”语音识别。我遇到的问题是 SpeechRecognitionEngine.SetInputToAudioStream() 似乎需要一个可以查找的定义长度的流。现在，我能想到的实现这项工作的唯一方法是，随着更多输入的输入，在 MemoryStream 上重复运行识别器。

下面是一些代码来说明：

            SpeechRecognitionEngine appRecognizer = new SpeechRecognitionEngine();

            System.Speech.AudioFormat.SpeechAudioFormatInfo formatInfo = new System.Speech.AudioFormat.SpeechAudioFormatInfo(8000, System.Speech.AudioFormat.AudioBitsPerSample.Sixteen, System.Speech.AudioFormat.AudioChannel.Mono);

            NetworkStream stream = new NetworkStream(socket,true);
            appRecognizer.SetInputToAudioStream(stream, formatInfo);
            // At the line above a "NotSupportedException" complaining that "This stream does not support seek operations."

有谁知道如何解决这个问题？它必须支持某种类型的流输入，因为它可以使用 SetInputToDefaultAudioDevice() 与麦克风一起正常工作。

谢谢，肖恩

我通过覆盖流类来实现实时语音识别：

class SpeechStreamer : Stream
{
    private AutoResetEvent _writeEvent;
    private List<byte> _buffer;
    private int _buffersize;
    private int _readposition;
    private int _writeposition;
    private bool _reset;

    public SpeechStreamer(int bufferSize)
    {
        _writeEvent = new AutoResetEvent(false);
         _buffersize = bufferSize;
         _buffer = new List<byte>(_buffersize);
         for (int i = 0; i < _buffersize;i++ )
             _buffer.Add(new byte());
        _readposition = 0;
        _writeposition = 0;
    }

    public override bool CanRead
    {
        get { return true; }
    }

    public override bool CanSeek
    {
        get { return false; }
    }

    public override bool CanWrite
    {
        get { return true; }
    }

    public override long Length
    {
        get { return -1L; }
    }

    public override long Position
    {
        get { return 0L; }
        set {  }
    }

    public override long Seek(long offset, SeekOrigin origin)
    {
        return 0L;
    }

    public override void SetLength(long value)
    {

    }

    public override int Read(byte[] buffer, int offset, int count)
    {
        int i = 0;
        while (i<count && _writeEvent!=null)
        {
            if (!_reset && _readposition >= _writeposition)
            {
                _writeEvent.WaitOne(100, true);
                continue;
            }
            buffer[i] = _buffer[_readposition+offset];
            _readposition++;
            if (_readposition == _buffersize)
            {
                _readposition = 0;
                _reset = false;
            }
            i++;
        }

        return count;
    }

    public override void Write(byte[] buffer, int offset, int count)
    {
        for (int i = offset; i < offset+count; i++)
        {
            _buffer[_writeposition] = buffer[i];
            _writeposition++;
            if (_writeposition == _buffersize)
            {
                _writeposition = 0;
                _reset = true;
            }
        }
        _writeEvent.Set();

    }

    public override void Close()
    {
        _writeEvent.Close();
        _writeEvent = null;
        base.Close();
    }

    public override void Flush()
    {

    }
}

...并使用它的实例作为 SetInputToAudioStream 方法的流输入。一旦流返回长度或返回的计数小于请求的计数，识别引擎就会认为输入已完成。这将设置一个永远不会完成的循环缓冲区。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Sockets

Streaming

SpeechRecognition

sapi

将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine 的相关文章

有没有快速创建集合的方法？

目前我正在创建一个像这样的新集 std set a s s insert a1 s insert a2 s insert a3 s insert a10 有没有办法创建s在一行 int myints 10 20 30 40 50 std s
EF Core 通过完全替换断开集合导航属性的更新

使用 EF Core 5 0 我有一个 SPA 页面可以加载Group实体及其集合Employee来自 API 的实体 var groupToUpdate await context Groups Include g gt g Emplo
VS 程序在调试模式下崩溃，但在发布模式下不崩溃？

我正在 VS 2012 中运行以下程序来尝试 Thrust 函数查找 include cuda runtime h include device launch parameters h include
我如何在 C# .NET（win7 手机）中使用“DataContractJsonSerializer”读入“嵌套”Json 文件？

我有一个问题如果我的 json 文件看起来像这样 Numbers 45387 Words 空间桶我可以很好地阅读它但是如果它看起来像这样 Main Numbers 45387 Words 空间桶某事数字 12345 单词克兰斯基
信号处理程序有单独的堆栈吗？

信号处理程序是否有单独的堆栈就像每个线程都有单独的堆栈一样这是在 Linux C 环境中来自 Linux 手册页signal 7 http kernel org doc man pages online pages man7 sign
找不到 assimp-vc140-mt.dll ASSIMP

我已经从以下位置下载了 Assimp 项目http assimp sourceforge net main downloads html http assimp sourceforge net main downloads html Ass
动态生成的控件 ID 返回为 NULL

我可以在 Page PreInit 函数中创建动态控件如何检索控件及其 ID 我的 C 代码用于创建动态控件之一 var btn new WebForms Button btn Text btn ID Addmore btn Click
如何获取 QTableView 的标题列表？

我有一个QTableView我的对话框中的对象我需要访问该表的水平标题并将它们放入QStringList object 尽管进行了大量搜索但我在 Qt 文档中找不到如何获取此标头列表编辑我发现的最接近的地方是this https w
从 WebBrowser 控件 C# 获取滚动值

我试图在 WebBrowser 控件中获取网页的 Y 滚动索引但无法访问内置滚动条的值有任何想法吗对于标准模式下的 IE 使用文档类型正如你所说 scrollTop是的财产元素而不是 HtmlDocument htmlDoc th
为什么 set_symmetry_difference 无法与比较器一起使用？

Example program include
如何从文本文件读取整数到数组

这就是我想做的我对此有些不满但我希望你能容忍我这对我来说是一个非常新的概念 1 在我的程序中我希望创建一个包含 50 个整数的数组来保存来自文件的数据我的程序必须获取用户的文档文件夹的路径 2 文件的名称为 grades txt
如何在服务器端按钮点击时关闭当前标签页？

我尝试在确认后关闭当前选项卡因此我将以下代码放在确认按钮的末尾但选项卡没有关闭 string jScript ClientScript RegisterClientScriptBlock this GetType keyClientBl
C++ php 和静态库

我创建了一个library a 其中包含 cpp 和 h 文件其中包含很多类嵌套类和方法我想在 php 示例中包含这个静态库并尝试使用它我想提一下我是 php 新手我已经在 test cpp 文件中测试了我的 libray a
将二进制数据从 C# 上传到 PHP

我想将文件从 Windows C 应用程序上传到运行 PHP 的 Web 服务器我知道 WebClient UploadFile 方法但我希望能够分块上传文件以便我可以监控进度并能够暂停恢复因此我正在读取文件的一部分并使用 We
是否有相当于 Clang/LLVM 的 .spec 文件，在哪里可以找到参考？

The gcc驱动程序可以配置为使用特定的链接器特定的选项和其他细节例如覆盖系统头 specs files 当前截至撰写本文时 GCC 版本 4 9 0 的手册此处描述了规范文件 https gcc gnu org onlinedoc
如何在c的case语句中使用省略号？

CASE expr no commas ELLIPSIS expr no commas 我在c的语法规则中看到了这样的规则但是当我尝试重现它时 int test float i switch i case 1 3 printf hi 它失
在 EnvDTE 中调试时捕获 VS 局部变量

是否可以使用 EnvDTE 进行 vsix Visual Studio 扩展来捕获本地和调试窗口使用的调试数据或者可以通过其他方法吗我想创建一个自定义的本地窗口我们可以修改它以根据需要显示一些较重的内容而无需为高级用户牺牲原始的本地
C++0x中disable_if在哪里？

Boost 两者都有enable if and disable if 但 C 0x 似乎缺少后者为什么它被排除在外 C 0x 中是否有元编程工具允许我构建disable if按照enable if 哦我刚刚注意到std enable i
使用 QtWebEngine 将 C++ 对象暴露给 Qt 中的 Javascript

使用 QtWebkit 可以通过以下方式将 C 对象公开给 JavascriptQWebFrame addToJavaScriptWindowObject如中所述https stackoverflow com a 20685002 5959
ASP.NET Core MVC 视图组件搜索路径

在此处的文档中 https learn microsoft com en us aspnet core mvc views view components view aspnetcore 2 2 https learn microsoft

随机推荐

定义自定义颜色变量

我想在我的代码中全局更改一些按钮颜色我似乎无法找到一种定义颜色变量然后为该变量分配颜色值的方法我试过这个颜色 SelectedColor new Color f1 setBackgroundColor Color rgb 0 0 10
C# 以编程方式执行 TNSPing

是否可以以编程方式在 Oracle 数据库上执行 TNSPing 我知道我可能可以调用 TNSPing 程序并解析生成的任何输出但我正在寻找一种更强大的方法来处理数据库 TNS Ping 看过了平级 http msdn microsoft
为什么 String 的 format(Object...args) 定义为静态方法？

我想知道为什么Java5 及以上版本提供了使用 String 类中的静态方法的 printf 样式格式化程序如下所示 public static String format String format Object args 代替 pub
如何在 ASP.Net 应用程序上使用 salting+hashing？

我正在从头开始构建一个项目并且我想以正确的方式做事我在网上读过有关哈希的内容这基本上就是将密码转换为 64 个字母的繁文缛节对吗腌制怎么样我的问题是如何使用 C 对字符串进行哈希处理 MSSQL 中的字段声明类型是什么 nva
MVC HTML5 电子邮件标签

我有一个模型 Required ErrorMessage Email required DataType DataType EmailAddress ErrorMessage Please enter valid email address
PowerPoint VBA 中的睡眠/等待计时器不是 CPU 密集型的

我目前正在制作一个 PowerPoint 演示文稿该演示文稿在计算机上用作某种信息亭或信息屏幕它从磁盘上的文本文件中读取文本该文本文件中的文本显示在 PowerPoint 的文本框中并且每 5 秒刷新一次这样我们就可以编辑 Pow
从查询引用子表单

在 MS Access 2010 中我有一个查询它在条件中引用了以下内容 Forms frm Add Item Subform ActiveControl Caption 这使我可以在查询中使用按钮的标题文本以下代码位于 Butt
将触摸和手势转发到 UIScrollview 的视图

我在转发手势和触摸时遇到一些问题我玩了很多次但我无法让它按照我想要的方式工作基本上我想用 2 个手指控制双屏幕上的滚动视图并将其他所有内容转发到重叠滚动视图后面的 ipad 视图为了能够控制双屏上的滚动视图我进行了子类化UISc
如何将包含 7 位毫秒数的日期字符串转换为 Python 中的日期

当毫秒有 6 位数字时 f 有效但如果超过 6 位数字则会抛出错误我有一个临时解决方案将第 7 位硬编码为 0 但是有更好的方法吗目前以下作品 print datetime datetime strptime 2014 11 19
ActiveAdmin - 如何在自定义操作中呈现默认模板

我们在 Rails3 应用程序中使用 ActiveAdmin 作为默认模型现在我们需要覆盖显示操作 OrderProcess 模型是瞬态无表模型这意味着所有字段都是从其他数据聚合而来的我们使用一个内部模块它提供了必要的方法来模拟
如何以缓存友好的方式访问灵活数组的数组？

I have records具有灵活的阵列成员 typedef struct record unsigned foo signed bar double number record 我有多个records与相同数量的numbers这样我就可
SignalR：加载集线器时出错

Signalr 不加载我的集线器 SignalR Error loading hubs Ensure your hubs reference is correct e g 我正在打电话app MapSignalR in startup co
未捕获的ReferenceError：未定义FileTransfer（使用cordova 2.7.0）

我想使用FileTransfer从网络服务器下载文件代码如下 function downloadFile url var fileTransfer new FileTransfer var uri encodeURI url var fi
异步填充DataTable？

我在 NET Core 2 0 应用程序中有以下功能 public DataTable CallDb string connStr string sql var dt new DataTable var da new SqlDataAdap
以管理员身份运行批处理文件命令错误.exe'未被识别为内部或外部命令

以管理员身份运行时出错 BackGroundJob exe 不被识别为内部或外部命令可操作程序或批处理文件 exe和bat文件都在同一个文件夹中当我运行它而不以管理员身份运行时它会运行但要安装此 exe 我需要从同一文件夹以管理员身份
CQRS 事件溯源：验证用户名唯一性

我们以一个简单的账户注册为例流程如下用户访问网站点击注册按钮并填写表格点击保存按钮 MVC 控制器通过读取 ReadModel 来验证用户名的唯一性 RegisterCommand 再次验证用户名唯一性这是问题当然
新的基数估计器 (SQL Server 2014) 还很遥远

我有一个数据仓库数据库但我在使用 SQL Server 2014 的新基数估计器时遇到问题将数据库服务器升级到 SQL Server 2014 后我发现查询性能存在很大差异某些查询的执行速度要慢得多 SQL 2012 中为 30 秒
从 Django 调用 MySQL 中的 DATE_FORMAT() 失败

我可以跑SET语句分配变量并使用事务在 mySQL 会话中维护它但是当我包含该函数时DATE FORMAT像这样 cursor execute SET dowToday CAST DATE FORMAT NOW w AS UNSIGN
将具有两个不同后缀的数据帧列堆叠成两列，最好使用 tidyverse [重复]

这个问题在这里已经有答案了假设我有一个数据框列表 mylist我想对每个数据帧执行相同的操作假设我的数据框如下所示 set seed 1 test tbl lt tibble case1 diff rnorm 10 0 case1 av
将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

我正在尝试从 TCP 套接字在 C 中进行流式语音识别我遇到的问题是 SpeechRecognitionEngine SetInputToAudioStream 似乎需要一个可以查找的定义长度的流现在我能想到的实现这项工作的唯一方

将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine 的相关文章

随机推荐

热门标签