有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？

2024-02-28

我有一个类型的缓冲区ReadOnlySequence<byte>。我想从中提取一个子序列（其中将包含 0 - n 条消息），方法是知道每条消息以0x1c, 0x0d（如所描述的here http://healthstandards.com/blog/2007/05/02/hl7-mlp-minimum-layer-protocol-defined/).

我知道缓冲区有一个扩展方法位置 https://learn.microsoft.com/en-us/dotnet/api/system.buffers.buffersextensions.positionof?view=netcore-3.1 but it

返回第一次出现的位置item in the ReadOnlySequence<T>.

我正在寻找一种方法，该方法可以返回最后一次出现的位置。我尝试自己实现它，这就是我到目前为止所拥有的

private SequencePosition? GetLastPosition(ReadOnlySequence<byte> buffer)
{
    // Do not modify the real buffer
    ReadOnlySequence<byte> temporaryBuffer = buffer;
    SequencePosition? lastPosition = null;

    do
    {
        /*
            Find the first occurence of the delimiters in the buffer
            This only takes a byte, what to do with the delimiters? { 0x1c, 0x0d }

        */
        SequencePosition? foundPosition = temporaryBuffer.PositionOf(???);

        // Is there still an occurence?
        if (foundPosition != null)
        {
            lastPosition = foundPosition;

            // cut off the sequence for the next run
            temporaryBuffer = temporaryBuffer.Slice(0, lastPosition.Value);
        }
        else
        {
            // this is required because otherwise this loop is infinite if lastPosition was set once
            break;
        }
    } while (lastPosition != null);

    return lastPosition;
}

我正在为此挣扎。首先PositionOf方法只需要一个byte但有两个分隔符，所以我必须传递一个byte[]。接下来我想我可以“以某种方式”优化循环。

您知道如何找到这些分隔符的最后一次出现吗？

我深入研究了这个问题，但我设法想出了一个扩展方法，我认为它回答了你的问题：

using System;
using System.Buffers;
using System.Collections.Generic;
using System.Linq;

public static class ReadOnlySequenceExtensions
{
    public static SequencePosition? LastPositionOf(
        this ReadOnlySequence<byte> source,
        byte[] delimiter)
    {
        if (delimiter == null)
        {
            throw new ArgumentNullException(nameof(delimiter));
        }
        if (!delimiter.Any())
        {
            throw new ArgumentException($"{nameof(delimiter)} is empty", nameof(delimiter));
        }

        var reader = new SequenceReader<byte>(source);
        var delimiterToFind = new ReadOnlySpan<byte>(delimiter);

        var delimiterFound = false;
        // Keep reading until we've consumed all delimiters
        while (reader.TryReadTo(out _, delimiterToFind, true))
        {
            delimiterFound = true;
        }

        if (!delimiterFound)
        {
            return null;
        }

        // If we got this far, we've consumed bytes up to,
        // and including, the last byte of the delimiter,
        // so we can use that to get the position of 
        // the starting byte of the delimiter
        return reader.Sequence.GetPosition(reader.Consumed - delimiter.Length);
    }
}

这里还有一些测试用例：

var cases = new List<byte[]>
{
    // Case 1: Check an empty array
    new byte[0],
    // Case 2: Check an array with no delimiter
    new byte[] { 0xf },
    // Case 3: Check an array with part of the delimiter
    new byte[] { 0x1c },
    // Case 4: Check an array with the other part of the delimiter
    new byte[] { 0x0d },
    // Case 5: Check an array with the delimiter in the wrong order
    new byte[] { 0x0d, 0x1c },
    // Case 6: Check an array with a correct delimiter
    new byte[] { 0x1c, 0x0d },
    // Case 7: Check an array with a byte followed by a correct delimiter
    new byte[] { 0x1, 0x1c, 0x0d },
    // Case 8: Check an array with multiple correct delimiters
    new byte[] { 0x1, 0x1c, 0x0d, 0x2, 0x1c, 0x0d },
    // Case 9: Check an array with multiple correct delimiters
    // where the delimiter isn't the last byte
    new byte[] { 0x1, 0x1c, 0x0d, 0x2, 0x1c, 0x0d, 0x3 },
    // Case 10: Check an array with multiple sequential bytes of a delimiter
    new byte[] { 0x1, 0x1c, 0x0d, 0x2, 0x1c, 0x1c, 0x0d, 0x3 },
};

var delimiter = new byte[] { 0x1c, 0x0d };
foreach (var item in cases)
{
    var source = new ReadOnlySequence<byte>(item);
    var result = source.LastPositionOf(delimiter);
} // Put a breakpoint here and examine result

Cases 1 to 5全部正确返回null. Cases 6 to 10全部正确返回SequencePosition到分隔符中的第一个字节（即在这种情况下，0x1c).

我还尝试创建一个迭代版本，在找到分隔符后会产生一个位置，如下所示：

while (reader.TryReadTo(out _, delimiterToFind, true))
{
    yield return reader.Sequence.GetPosition(reader.Consumed - delimiter.Length);
}

But SequenceReader<T> and ReadOnlySpan<T>不能在迭代器块中使用，所以我想出了AllPositionsOf反而：

public static IEnumerable<SequencePosition> AllPositionsOf(
    this ReadOnlySequence<byte> source,
    byte[] delimiter)
{
    if (delimiter == null)
    {
        throw new ArgumentNullException(nameof(delimiter));
    }
    if (!delimiter.Any())
    {
        throw new ArgumentException($"{nameof(delimiter)} is empty", nameof(delimiter));
    }

    var reader = new SequenceReader<byte>(source);
    var delimiterToFind = new ReadOnlySpan<byte>(delimiter);

    var results = new List<SequencePosition>();
    while (reader.TryReadTo(out _, delimiterToFind, true))
    {
        results.Add(reader.Sequence.GetPosition(reader.Consumed - delimiter.Length));
    }

    return results;
}

测试用例也能正常工作。

Update

现在我已经睡了一些觉，并且有机会思考一些事情，我认为上述问题可以改进，原因如下：

SequenceReader<T> has a Rewind()方法，这让我思考SequenceReader<T>被设计为可重复使用
SequenceReader<T>似乎是为了让它更容易使用而设计的ReadOnlySequence<T>一般而言
创建扩展方法ReadOnlySequence<T>为了使用SequenceReader<T>读取ReadOnlySequence<T>似乎倒退

鉴于上述情况，我认为尝试避免直接与ReadOnlySequence<T>在可能的情况下，优先选择并重复使用，SequenceReader<T>反而。考虑到这一点，这是一个不同的版本LastPositionOf现在是一个扩展方法SequenceReader<T>:

public static class SequenceReaderExtensions
{
    /// <summary>
    /// Finds the last occurrence of a delimiter in a given sequence.
    /// </summary>
    /// <param name="reader">The reader to read from.</param>
    /// <param name="delimiter">The delimeter to look for.</param>
    /// <param name="rewind">If true, rewinds the reader to its position prior to this method being called.</param>
    /// <returns>A SequencePosition if a delimiter is found, otherwise null.</returns>
    public static SequencePosition? LastPositionOf(
        this ref SequenceReader<byte> reader,
        byte[] delimiter,
        bool rewind)
    {
        if (delimiter == null)
        {
            throw new ArgumentNullException(nameof(delimiter));
        }
        if (!delimiter.Any())
        {
            throw new ArgumentException($"{nameof(delimiter)} is empty", nameof(delimiter));
        }

        var delimiterToFind = new ReadOnlySpan<byte>(delimiter);
        var consumed = reader.Consumed;

        var delimiterFound = false;
        // Keep reading until we've consumed all delimiters
        while (reader.TryReadTo(out _, delimiterToFind, true))
        {
            delimiterFound = true;
        }

        if (!delimiterFound)
        {
            if (rewind)
            {
                reader.Rewind(reader.Consumed - consumed);
            }

            return null;
        }

        // If we got this far, we've consumed bytes up to,
        // and including, the last byte of the delimiter,
        // so we can use that to get the starting byte
        // of the delimiter
        var result = reader.Sequence.GetPosition(reader.Consumed - delimiter.Length);
        if (rewind)
        {
            reader.Rewind(reader.Consumed - consumed);
        }

        return result;
    }
}

上面的测试用例继续通过，但我们现在可以重用相同的reader。此外，它还允许您指定是否要倒带到原始位置reader在被调用之前。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

NetCore

有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？的相关文章

在C语言中使用“void”

我很困惑为什么我们需要通过void转换为 C 函数 int f void return 0 versus int f return 0 什么是正确的做法以及为什么 In C int f 是一种老式的声明它说f需要固定但未指定数量和类型的参
查找哪些页面不再与写入时复制共享

假设我在 Linux 中有一个进程我从中fork 另一个相同的过程后forking 因为原始进程将开始写入内存 Linux写时复制机制将为进程提供与分叉进程使用的不同的唯一物理内存页在执行的某个时刻我如何知道原始进程的哪些页面已被写
在搜索 List 时，为什么 Enumerable.Any(Func predicate) 比带有 if 语句的 foreach 慢

最近有件事引起了我的好奇心 Why is the Enumerable Any Func
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
C#动态支持吗？

看完之后这个帖子 https stackoverflow com questions 2674906 when should one use dynamic keyword in c sharp 4 0k和链接我还有 2 个问题问题 1
为什么我不能用 `= delete;` 声明纯虚函数？

Intro 纯虚函数使用通用语法声明 virtual f 0 然而自 c 11 以来有一种方法可以显式地传达non existence 特殊成员函数的 Mystruct delete eg default constructor Q
从 MVC 迁移到 ASP.NET Core 3.1 中的端点路由时，具有角色的 AuthorizeAttribute 不起作用

我正在尝试将我的项目从 UseMVC asp net core 2 2 兼容样式升级到 UseEndpoint Routing 并且我的所有请求都被重定向到我的验证失败页面它与声明有关如果我删除 Authorize Roles Adm
C++：重写已弃用的虚拟方法时出现弃用警告

我有一个纯虚拟类它有一个纯虚拟方法应该是const 但不幸的是不是该接口位于库中并且该类由单独项目中的其他几个类继承我正在尝试使用这个方法const不会破坏兼容性至少在一段时间内但我找不到在非常量方法重载时产生警告的方法以下
什么会阻止 Docker 容器中运行的代码连接到单独服务器上的数据库？

我有一个在 Ubuntu 14 04 上的 Docker 容器中运行的 NET Core 1 1 应用程序它无法连接到在单独服务器上运行的 SQL Server 数据库错误是未处理的异常 System Data SqlClient S
JSON 数组到 C# 列表

如何将这个简单的 JSON 字符串反序列化为 C 中的列表 on4ThnU7 n71YZYVKD CVfSpM2W 10kQotV 这样 List
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
当前的 c++ 工作草案与当前标准有何不同

通过搜索该标准的 PDF 版本我最终找到了这个链接C 标准措辞草案 http www open std org jtc1 sc22 wg21 docs papers 2012 n3376 pdf从 2011 年开始我意识到我可以购买最终
如何重置捕获像素的值

我正在尝试创建一个 C 函数该函数返回屏幕截图位图中每四个像素的 R G 和 B 值这是我的代码的一部分 for int ix 4 ix lt 1366 ix ix 4 x x 4 for int iy 3 iy lt 768 iy i
为什么我不应该对不是由 malloc() 分配的变量调用 free() ？

我在某处读到使用它是灾难性的free删除不是通过调用创建的对象malloc 这是真的为什么这是未定义的行为永远不要尝试它让我们看看当您尝试时会发生什么free 自动变量堆管理器必须推断出如何获取内存块的所有权为此它要么必须使
当我“绘制”线条时，如何将点平均分配到 LineRenderer 的宽度曲线？

我正在使用线条渲染器创建一个绘图应用程序现在我尝试使用线条渲染器上的宽度曲线启用笔压问题在于 AnimationCurve 的时间值水平轴从 0 标准化为 1 因此我不能在每次添加位置时都在其末尾添加一个值除非有一个我不知
耐用功能是否适合大量活动？

我有一个场景需要计算 500k 活动都是小算盘由于限制我只能同时计算 30 个想象一下下面的简单示例 FunctionName Crawl public static async Task
当前的 x86 架构是否支持非临时加载（来自“正常”内存）？

我知道有关此主题的多个问题但是我没有看到任何明确的答案或任何基准测量因此我创建了一个处理两个整数数组的简单程序第一个数组a非常大 64 MB 第二个数组b很小无法放入 L1 缓存程序迭代a并将其元素添加到相应的元素中b在模块化
使用 CSharpCodeProvider 类编译 C# 7.3 的 C# 编译器版本是什么？

我想使用 Microsoft CSharp CSharpCodeProvider 类来编译 C 7 3 代码编译器版本在 IDictionary 中指定在创建新的 CSharpCodeProvider 时将其作为输入例如 Compil
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在
Googletest：如何异步运行测试？

考虑到一个包含数千个测试的大型项目其中一些测试需要几分钟才能完成如果按顺序执行整套测试需要一个多小时才能完成通过并行执行测试可以减少测试时间据我所知没有办法直接从 googletest mock 做到这一点就像 async选项

随机推荐

如何在 Django 中使用新数据库重新开始？

我删除了我的数据库我想用一个新的数据库重新开始我怎样才能做到这一点我尝试创建一个新的数据源但在应用迁移或迁移时出现错误无法找到表这是真的因为它是一个空数据库当有人提取我的代码版本时也会出现类似的情况他不会有迁移或数据库
RMagick + Rails + Heroku？

我想弄清楚如何在我的应用程序上使用 rmagick 然后使其在 Heroku 上运行对于 Rails3 您必须添加此规范 gem rmagick 2 12 0 require gt RMagick 注意要求区分大小写
序言中的谓词

我需要在 prolog 中定义一个谓词它将一个列表作为输入对 gt 5 的数字的平方求和并减去这就是我目前所拥有的 pred 0 pred Head Tail Result gr85 Head pred Tail Total Res
使用 scan!() 读取 u8 时出现“宏未定义”

我读到有关读取整数输入的内容如何在 Rust 1 0 中读取用户输入的整数 https stackoverflow com questions 30355185 how to read an integer input from the u
使用 Nuxt.js 进行开发和生产的不同 baseURL

如何为开发和生产添加不同的baseURL 这是目前我的 nuxt config js module exports mode universal axios See https github com nuxt community axios
为什么 Karma 配置文件排除选项不起作用？

我的示例 Angular 应用程序中有两个规范文件规格文件名称是src app app component spec ts src app app component two spec ts 我只想运行文件中的测试src app app
Sidekiq - 重新安排失败的作业

我有一个后台工作使用 Sidekiq 连接到我的另一个服务如下所示 def perform id user ABCClient instance user id end 有时这个 ABCClient 会宕机在这种情况下我想重新安排执
如何使用 Django-oauth-toolkit 进行身份验证，通过 Django-rest-framework 测试 API 端点

我有一个 Django rest framework 视图集路由器来定义 API 端点视图集定义如下 class DocumentViewSet viewsets ModelViewSet permission classes perm
如何检查 MongoDB 中的数组字段是否包含唯一值或另一个数组？

我现在用的是mongodb 我有一个博客文章集它有一个tags字段是一个数组例如 blogpost1 tags tag1 tag2 tag3 tag4 tag5 blogpost2 tags tag2 tag3 blogpost3 ta
Android / 9-patch PNG：如果我需要像 11-patch PNG 这样的东西怎么办？

在 Draw 9 patch 中一切看起来都很好 However 我的 SDK 说 9 patch png 格式错误因为我有类似 11 patch png 的东西因为我不希望小抓取区域被缩放如何让它发挥作用截图描述了一切控制台中
NodeJs：缓慢的 req.pipe

我发现 tus 的服务器实现 https tus io https tus io 对于nodejs https github com tus tus node server https github com tus tus node ser
gevent 和 posgres：异步连接失败

我正在使用 gevent 处理基于 Django 的 Web 系统上的 API I O 我已经使用以下方法进行了猴子补丁 import gevent monkey gevent monkey patch socket 我已经使用以下方法修补
Web、应用程序和移动编程之间的主要技术区别是什么？

我想知道Web ASP PHP Ruby等之间的主要技术区别是什么应用程序 C C NET Java 和移动 J2ME Objective C 编程这是最难的如果有人学会了其中之一他可以轻松地切换到其他之一吗首先从一个技术的从
Android 共享图片不起作用

我正在尝试使用以下代码共享应用程序的屏幕截图 View content findViewById R id layoutHome content setDrawingCacheEnabled true Bitmap bitmap conte
Plotly Dash 中心 dcc.输入文本字段

我在弄清楚居中需要哪些样式参数时遇到了很多困难dash core components Input我的页面中间的文本字段 import dash import dash core components as dcc import dash
NSNumberFormatter 不允许输入十进制数字

我对 NSNumberFormatter 的使用感到非常困惑这应该非常简单但我无法让它工作我想设置一个 NSTextField 以允许输入带小数点或不带小数点的十进制数字这是我认为可行的 NSNumberFormatter form
从现有 Makefile 创建 CMakeLists 文件

我想用cmake为 C 项目生成构建文件我有一个现有的Makefile 我在生成这个时遇到问题Makefile使用标准cmake句法如何包含标准 C 库例如 lstdc lpthread lboost thread mt in the
Django 使用 locals() [重复]

这个问题在这里已经有答案了我是 Django Web 开发的初学者我注意到locals 使用函数代替我习惯看到的上下文字典据我在网上看到的locals 非常有用那么是否有任何特殊情况这不是真的最好使用context dictio
Heroku Django，模板不存在错误

因此经过几个深夜的工作我终于将我的应用程序部署到 Heroku 上但现在出现了不同的问题彻夜难眠模板不存在错误我使用的是 Django 1 11 所以我的设置如下 INSTALLED APPS django contrib a
有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？

我有一个类型的缓冲区ReadOnlySequence

有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？

Update

有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？ 的相关文章

随机推荐

热门标签

有类似 Buffer.Last Position Of 的东西吗？查找缓冲区中最后一次出现的字符？的相关文章