如何从无限字节流中读取 UTF-8 字符 - C#

2024-02-24

通常,要从字节流中读取字符,您可以使用 StreamReader。在此示例中,我从无限流中读取由“\r”分隔的记录。

using(var reader = new StreamReader(stream, Encoding.UTF8))
{
    var messageBuilder = new StringBuilder();
    var nextChar = 'x';
    while (reader.Peek() >= 0)
    {
        nextChar = (char)reader.Read()
        messageBuilder.Append(nextChar);

        if (nextChar == '\r')
        {
            ProcessBuffer(messageBuilder.ToString());
            messageBuilder.Clear();
        }
    }
}

问题是 StreamReader 有一个小的内部缓冲区,因此如果代码等待“记录结束”分隔符(在本例中为“\r”),它必须等到 StreamReader 的内部缓冲区被刷新(通常是因为更多字节)已经到了)。

此替代实现适用于单字节 UTF-8 字符,但不适用于多字节字符。

int byteAsInt = 0;
var messageBuilder = new StringBuilder();
while ((byteAsInt = stream.ReadByte()) != -1)
{
    var nextChar = Encoding.UTF8.GetChars(new[]{(byte) byteAsInt});
    Console.Write(nextChar[0]);
    messageBuilder.Append(nextChar);

    if (nextChar[0] == '\r')
    {
        ProcessBuffer(messageBuilder.ToString());
        messageBuilder.Clear();
    }
}

如何修改此代码以使其适用于多字节字符?


而不是Encoding.UTF8.GetChars它旨在转换完整的缓冲区,获取一个实例Decoder并重复调用其成员方法GetChars http://msdn.microsoft.com/en-us/library/system.text.decoder.getchars.aspx这将利用Decoder的内部缓冲区,用于处理从一次调用结束到下一次调用的部分多字节序列。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从无限字节流中读取 UTF-8 字符 - C# 的相关文章

  • 将处理后的图形绘制到另一个图形中

    我想将一个经过处理的图形绘制到另一个图形中 I have two graphics var gHead Graphics FromImage h var gBackground Graphics FromImage b Transform
  • Mono 无法保存用户设置

    我在 Mono Ubuntu 上保存用户设置时遇到问题 这是代码示例 private void Form1 Load object sender EventArgs e string savedText Properties Setting
  • 添加对共享类的多个 WCF 服务的服务引用

    我正在尝试将我的 WCF Web 服务拆分为几个服务 而不是一个巨大的服务 但是 Visual Studio Silverlight 客户端 复制了两个服务共享的公共类 这是一个简单的例子来说明我的问题 在此示例中 有两个服务 两者都返回类
  • 在 C++ 中分割大文件

    我正在尝试编写一个程序 该程序接受一个大文件 任何类型 并将其分成许多较小的 块 我想我已经有了基本的想法 但由于某种原因我无法创建超过 12 kb 的块大小 我知道谷歌等上有一些解决方案 但我更感兴趣的是了解这个限制的根源是什么 然后实际
  • Blazor 与 Razor

    随着 Blazor 的发明 我想知道这两种语言之间是否存在显着的效率 无论是在代码创建方面还是在代码的实际编译 执行方面 https github com SteveSanderson Blazor https github com Ste
  • 有什么工具可以说明每种方法运行需要多长时间?

    我的程序的某些部分速度很慢 我想知道是否有我可以使用的工具 例如它可以告诉我可以运行 methodA 花了 100ms 等等 或者类似的有用信息 如果您使用的是 Visual Studio Team System 性能工具 中有一个内置分析
  • 调试内存不足异常

    在修复我制作的小型 ASP NET C Web 应用程序的错误时 我遇到了 OutOfMemoryException 没有关于在哪里查看的提示 因为这是一个编译时错误 如何诊断此异常 我假设这正是内存分析发挥作用的地方 有小费吗 Thank
  • 为什么 BOOST_FOREACH 不完全等同于手工编码的?

    From 增强文档 http www boost org doc libs 1 48 0 doc html foreach html foreach introduction what is literal boost foreach li
  • 为什么密码错误会导致“填充无效且无法删除”?

    我需要一些简单的字符串加密 所以我编写了以下代码 有很多 灵感 来自here http www codeproject com KB security DotNetCrypto aspx create and initialize a cr
  • C++11 函数局部静态 const 对象的线程安全初始化

    这个问题已在 C 98 上下文中提出 并在该上下文中得到回答 但没有明确说明有关 C 11 的内容 const some type create const thingy lock my lock some mutex static con
  • gdb 在 docker 上立即退出“进程已完成,退出代码 1”或 lldb“数据包返回错误 8”。另外:如何在 docker 中允许进行 C++ 调试

    这花了我一整天的时间才找到 所以我将其发布以供将来参考 我正在 docker 镜像上开发 C 我正在使用克利翁 我的代码是在调试模式下编译的 并且在运行模式下运行良好 但是当尝试调试时 进程会立即退出 并显示非常丰富的信息 Process
  • 范围和临时初始化列表

    我试图将我认为是纯右值的内容传递到范围适配器闭包对象中 除非我将名称绑定到初始值设定项列表并使其成为左值 否则它不会编译 这里发生了什么 include
  • 两组点之间的最佳匹配

    I ve got two lists of points let s call them L1 P1 x1 y1 Pn xn yn and L2 P 1 x 1 y 1 P n x n y n 我的任务是找到它们点之间的最佳匹配 以最小化它
  • C# 创建数组的数组

    我正在尝试创建一个将使用重复数据的数组数组 如下所示 int list1 new int 4 1 2 3 4 int list2 new int 4 5 6 7 8 int list3 new int 4 1 3 2 1 int list4
  • “MyClass”的类型初始值设定项引发异常

    以下是我的Windows服务代码 当我调试代码时 我收到错误 异常 CSMessageUtility CSDetails 的类型初始值设定项引发异常 using System using System Collections Generic
  • 从匿名类型获取值

    我有一个方法如下 public void MyMethod object obj implement 我这样称呼它 MyMethod new myparam waoww 那么我该如何实施MyMethod 获取 myparam 值 Edit
  • C# 搜索目录中包含字符串的所有文件,然后返回该字符串

    使用用户在文本框中输入的内容 我想搜索目录中的哪个文件包含该文本 然后我想解析出信息 但我似乎找不到该字符串或至少返回信息 任何帮助将不胜感激 我当前的代码 private void btnSearchSerial Click object
  • gdb查找行号的内存地址

    假设我已将 gdb 附加到一个进程 并且在其内存布局中有一个文件和行号 我想要其内存地址 如何获取文件x中第n行的内存地址 这是在 Linux x86 上 gdb info line test c 56 Line 56 of test c
  • 如何确定母版页中正在显示哪个子页?

    我正在母版页上编写代码 我需要知道正在显示哪个子 内容 页面 我怎样才能以编程方式做到这一点 我用这个 string pageName this ContentPlaceHolder1 Page GetType FullName 它以 AS
  • WPF/数据集:如何通过 XAML 将相关表中的数据绑定到数据网格列中?

    我正在使用 WPF DataSet 连接到 SQL Server Express XAML 和 C Visual Studio 2013 Express 我从名为 BankNoteBook 的现有 SQL Server Express 数据

随机推荐

  • SWIFT 在 Main.storyboard 中定义的 UIImageview 中旋转图像

    我是 SWIFT 新手 正在练习学习 但在某些方面遇到了一些困难 我在 Main storyboard 定义的 UIImageview 中有一个图像 我需要旋转它 我有一个 IBOutlet 定义为 IBOutlet weak var im
  • 如何在 Redux 中为每个实例创建一个存储?

    有时 在 Redux 应用程序中为每个实例创建一个存储会很有用 Redux 的创建者自己创建了一个 Gist 来描述如何实现这一点 https gist github com gaearon eeee2f619620ab7b55673a4e
  • 在 c# 中使用 gmail API 修改消息标签时出现权限不足 [403] 错误

    我正在尝试使用 gmail api 读取 gmail 邮件消息 阅读邮件后 我将删除消息标签 这样我就不需要再次处理它 我能够成功阅读邮件 但是当我尝试修改邮件标签时 service Users Messages Modify mods u
  • 如何将 JSON 转换为字符串数组

    是否可以使用for json path以 JSON 数组格式格式化行 我有一个这样的专栏 Col1 abc def ghi jkl 我想像这样格式化它 Col1 abc def ghi jkl 到目前为止我已经让它看起来像这样 Col1 a
  • 如何从 C# 数组中删除重复项?

    我一直在与一个string C 中从函数调用返回的数组 我可能可以投射到Generic集合 但我想知道是否有更好的方法来做到这一点 可能通过使用临时数组 从 C 数组中删除重复项的最佳方法是什么 您可以使用 LINQ 查询来执行此操作 in
  • Web Api 参数始终为空

    当我使用下面的ajax调用下面的Post方法时 为什么参数总是为空 public IEnumerable
  • UWP 应用程序因多个错误而失败 WACK

    过去 我成功开发了一些 UWP 应用程序并将其部署到 MS Store 目前 在尝试通过 WACK 测试时 遇到了大量意想不到的失败 这些失败是我以前从未遇到过的类型 我在 2017 年 11 月开始了这个特定的项目 从技术上讲 它并没有那
  • 如何检测 Android 设备麦克风中的打击

    如何检测用户何时向设备麦克风吹气 然后 这将用于触发应用程序的某些操作 检测用户何时向麦克风吹气的工作可分为两部分 1 从麦克风获取输入 2 监听吹气声音 向麦克风吹气的噪音 声音由低频声音组成 我们将使用低通滤波器来减少进入麦克风的高频声
  • Android proguard 问题:路径不能为 null 或空字符串。路径='空'

    设置之前一切正常 minifyEnabled true and 收缩资源 true 设置这些值后 每当我运行项目时 我都会收到此错误 Information Gradle tasks app assembleProdRelease Erro
  • Mac OSX 上的 laravel homestead/vagrant/virtualbox 非常慢

    我在用Mac 上的 Homestead Vagrant Virtualbox Problem 虽然我发现很多线程 答案如何解决响应时间慢的问题 例如 TTFB 但没有一个起作用 我的响应时间在 25 32 秒之间 这对于本地开发来说显然是不
  • SQL 错误:ORA-02291:完整性约束

    我正在创建一个试图从外键访问值的数据库 我创建了以下两个表 CREATE TABLE Component ComponentID varchar2 9 PRIMARY KEY TypeID varchar2 9 REFERENCES Typ
  • 使用信号量实现 N 进程屏障

    我目前正在为之前迭代的操作系统考试进行培训 我遇到了这个 实施 N 进程屏障 即 是 确保每个流程都完成 他们中的一群人在某个时刻等待着 点在其各自的执行中 对于 其他进程达到他们的 给定点 您有以下内容 可用操作 init sem val
  • 删除核心数据中的重复对象(swift)

    我将对象保存到 JSON 中的核心数据 这是我使用for循环 假设我称之为setup功能 由于用户可能会停止此循环 因此核心数据中保存的对象将是部分的 用户可以重新启动此setup函数 重新启动解析和将对象保存到核心数据的过程 现在 如果我
  • 使用 Linux sort 命令对多个键进行排序

    说我有这个文件 cat a txt c 1002 4 f 1001 1 d 1003 1 a 1001 3 e 1004 2 b 1001 2 我想按第二列排序 然后按第三列排序 第二列是数字 而第三列可以视为字符串 我知道以下命令效果很好
  • 单击任意位置以在 CKEditor 中聚焦

    在 FireFox 中 我可以单击 CKEditor 350px x 250px 中的任意位置 将焦点放在编辑器顶部的单个文本段落上 然而 在 IE6 中 我知道 但我们的客户坚持 我必须直接单击段落顶部以将光标聚焦并随后编辑文本 CKEd
  • STD 集合中引用的生命周期

    对 STD 集合 例如映射 返回的元素的引用有效多久 例如 在这段代码中 struct Employee int salary string name the key map
  • JavaTypeDescriptorRegistry - 找不到所请求的 Java 类的匹配类型描述符

    我有一个项目运行没有任何问题 除了这个警告消息 WARN org hibernate type descriptor java JavaTypeDescriptorRegistry Could not find matching type
  • 从第三方将CSS注入到iframe中

    我们可以将一堆 CSS 文件从第三方 例如托管广告的 OAS 注入到 iframe 中吗 如果可能的话 我们将不胜感激 通过使用 jQuery 选择器 您应该能够做到这一点 但是 对 iframe 内容不应有任何限制 即它应该来自同一域 对
  • 使用 StreamReader 检查文件是否包含字符串

    我有一个字符串是args 0 到目前为止 这是我的代码 static void Main string args string latestversion args 0 create reader open file using Strea
  • 如何从无限字节流中读取 UTF-8 字符 - C#

    通常 要从字节流中读取字符 您可以使用 StreamReader 在此示例中 我从无限流中读取由 r 分隔的记录 using var reader new StreamReader stream Encoding UTF8 var mess