对 unicode 文件使用 getline 时出现问题

2023-12-25

更新：感谢 @Potatoswatter 和 @Jonathan Leffler 的评论 - 相当尴尬的是，我被调试器工具提示发现没有正确显示 wstring 的值 - 但它仍然不太适合我，我已经更新了问题以下：

如果我有一个小的多字节文件，我想读入一个字符串，我使用以下技巧 - 我使用getline分隔符为'\0' e.g.

std::string contents_utf8;
std::ifstream inf1("utf8.txt");
getline(inf1, contents_utf8, '\0');

这会读入整个文件，包括换行符。
但是，如果我尝试用宽字符文件做同样的事情，它就不起作用 - 我的wstring只读到第一行。

std::wstring contents_wide;
std::wifstream inf2(L"ucs2-be.txt");
getline( inf2, contents_wide, wchar_t(0) ); //doesn't work

例如，如果 unicode 文件包含由 CRLF 分隔的字符 A 和 B，则十六进制如下所示：

FE FF 00 41 00 0D 00 0A 00 42

基于这样的事实，使用带有“\0”的多字节文件 getline 读取整个文件，我相信getline( inf2, contents_wide, wchar_t(0) )应该读取整个 unicode 文件。然而事实并非如此 - 在上面的示例中，我的宽字符串将包含以下两个 wchar_t：FF FF

（如果我删除 wchar_t(0) ，它会按预期读取第一行（即FE FF 00 41 00 0D 00)

为什么 wchar_t(0) 不能用作定界 wchar_t 以便 getline 停止00 00（或者读到我想要的文件末尾）？
谢谢

您的 UCS-2 解码器行为不正常。的结果getline( inf2, contents_wide ) on FE FF 00 41 00 0D 00 0A 00 42应该0041 0000 = L"A"。假设您使用的是 Windows，则应正确转换行结尾，并且字节顺序标记不应出现在输出中。

建议仔细检查操作系统文档以了解如何设置区域设置。

EDIT:你设置了区域设置吗？

locale::global( locale( "something if your system supports UCS-2" ) );

locale::global( encoding_support::ucs2_bigendian_encoding );

其中encoding_support是某个库。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对 unicode 文件使用 getline 时出现问题的相关文章

在哪里使用 EF6 订阅 ObjectMaterialized？

我正在尝试将我的上下文订阅到以下 OnjectMaterialized 事件this https stackoverflow com a 3756842 2835713 像这样 IObjectContextAdapter this Obje
在列表中查找匹配项的最简洁方法

在列表中查找内容的最佳方式是什么我知道 LINQ 有一些不错的技巧但我们也可以获取有关 C 2 0 的建议让我们对这个常见的代码模式进行最佳重构目前我使用这样的代码 mObjList is a List
在 C++ 中，当我将值传递给函数时，它是否总是转换为适当的类型？

如果我有一个像这样的函数void func size t x 我称该函数为func 5 5 立即转换为size t类型这通常适用于所有类型吗我问这个问题是因为我发誓我见过人们编写代码他们做类似的事情func 5 0 将 5 作为双精度
在 C++ 中，std::string::push_back() 的摊余复杂度是 O(1) 吗？

我知道标准指定它适用于向量但是字符串呢是的它是摊销常数时间请参见第 716 页的表 101本文件的 http www open std org jtc1 sc22 wg21 docs papers 2012 n3485 pdf 表
为什么不能使用initializer_list来初始化unique_ptr的向量？ [复制]

这个问题在这里已经有答案了我想知道为什么initializer list 不能与unique ptr 一起使用 std vector
函数的不明确的引用/值版本

考虑以下函数原型 void Remove SomeContainer Vec const std size t Index SomeContainer Remove SomeContainer Vec const std size t In
ASP.NET Core 中 AsNoTracking 的模拟或更好的解决方法

您如何模拟 AsNoTracking 或者是否有更好的解决方法来解决此问题 Example public class MyContext MyContextBase Constructor public MyContext DbContex
ASP.NET 数据集 getdataBy 无法启用约束。一行或多行包含违反非空、唯一或外键约束的值

你好我有一个非常简单的网络表单我在此表单上有一个按钮和一个网格视图以及一个包含链接表 bill docket docket bill 等的数据集在按钮上单击我使用以下代码 protected void button click ob
对无符号 8 位整数进行左移操作 [重复]

这个问题在这里已经有答案了我试图理解 C C 中的移位运算符但它们给我带来了困难我有一个无符号 8 位整数初始化为一个值例如 1 uint8 t x 1 根据我的理解它在内存中的表示方式如下 0 0 0 0 0 0 0 1 现在
Math.Sin、Math.Cos 和 Math.Tan 精度以及正确显示它们的方法

我正在用 C 编写一个计算器 textBoxResult是一个文本框我在其中显示数字 recount是以度为单位获取角度并以弧度为单位返回的函数我的角度是从texBoxInput public double recount int nu
使用 C# 和 .NET Core 在 AWS Cognito 用户池中进行用户管理

如何使用 C 和 NET Core 3 x 管理 AWS Cognito 用户池中的用户在文档中找不到有关它的任何内容 Attilio Gelosa 的原创文章我写这篇文章是希望对其他人有帮助我必须阅读一页又一页的文档并从 AWS
如何从 Function App 设置会话 ID 或创建自定义字段到 Application Insights

功能应用程序如下 public static async Task
C# 或 Windows 相当于 OS X 的 Core Data？

我迟到了现在才开始在 OS X Cocoa 中使用 Core Data 它令人难以置信并且确实改变了我看待事物的方式 C 或现代 Windows 框架中是否有等效的技术即拥有可免费保存数据管理删除搜索的托管数据类型还想知道Li
如何明智地解释这个编译器警告？

当我执行这段代码时question https stackoverflow com a 51056490 2411320 我收到这个警告 warning format d expects argument of type int but a
std::iota 的 iota 代表什么？

我假设 i 是增量 a 是分配但我无法弄清楚或找到答案而且它看起来与非标准非常相似itoa我认为这很令人困惑 C iota is not an acronym or an initialism It is the word iota
C 中函数“fgets”的参数太少

每当我编译这个错误时我都会收到该错误但我不知道为什么我直接从书上抄袭这个有人可以帮忙吗 include
为什么 char 数组需要 strcpy 而 char star 不需要 - 在 C 中使用结构

我对这段代码有一个误解 typedef struct EXP int x char name char lastName 40 XMP main XMP a a name eaaa a lastName strcpy a lastName
使用 QTestLib 时抑制 qDebug

我正在向 Qt 中的项目添加单元测试并希望使用 QTestLib 我已经设置了测试并且它们运行良好问题是在项目中我们重写了 qDebug 以输出到我们自己的日志文件这在运行应用程序时效果很好问题是当我测试类时它有时会开始记录然后
使texture2D在运行时/脚本Unity3D中可读[重复]

这个问题在这里已经有答案了我有一个插件可以让我访问 Android 手机图库中的图片这给了我一个Texture2D类型的纹理然后我想使用 GetPixels 函数对其进行编辑但默认情况下它未设置为可读如何使纹理可读以便我可以在
频繁插入已排序的集合

我已经对集合列表进行了排序并且我需要始终保持其排序我目前在我的集合上使用 List BinarySearch 然后在正确的位置插入元素我也尝试过在每次插入后对列表进行排序但性能不可接受有没有一种解决方案可以提供更好的性能也许

随机推荐

媒体播放器准备失败

过去 8 个小时我一直在尝试开发一个简单的录音播放应用程序我希望能够以 3GP 格式录制音频然后将其自动加载到MediaPlayer这样我就可以播放它我 80 确定它正在录制并保存到代码中指定的位置但是当我尝试将其加载到我的媒体播
在 Gear S2 设备上启动 Web 应用程序时出现错误 81

我正在使用 Tizen SDK 2 4 0 Rev5 在 Gear S2 上启动演示应用程序 HelloTizen wearable 2 3 但失败并出现以下错误 Unknown Error 81 Unknown Error 81 当我尝试
Javascript 模板 - 深度嵌套是否可能

我正在构建一个任务应用程序为了好玩我只是坐下来思考这个问题我在这里用文字把这个问题记在心里模型非常简单它包含以下集合Project 每个项目包含一个TaskList这些任务列表是nestable即例如一个任务设计首页可以有设计标头
std::unique_ptr 作为 std::thread 中函数的参数[重复]

这个问题在这里已经有答案了所以我想通过std unique ptr作为在单独线程中启动的函数的参数我在编译时收到一个奇怪的错误内容如下 1 gt c program files x86 microsoft visual studio
如何正确使用“cv2.putText”在图像上绘制阿拉伯文本？（Python+OpenCV）

我使用 python cv2 window10 python3 6 在图像中写入文本当文本是英文时它可以工作但是当我使用阿拉伯文本时它会在图像中写入混乱的代码下面是我的代码 import cv2 import numpy as np
fork() 和 vfork() 有什么区别？

有什么区别fork http pubs opengroup org onlinepubs 9699919799 functions fork html and vfork http man7 org linux man pages man2
如何使用 python win32com 或 comtypes 中的 COM 访问 IRTDServer？

环境 Windows 10 python 3 6 3 64 位也尝试过 32 位我是一名 Python 开发人员几乎第一次尝试使用 COM 但遇到了这个巨大的障碍 Problem 当我尝试使用在 dll 中实现的 IRTDServe
如何在 SQL Server 事务中设置“SET XACT_ABORT ON”？

我想设置SET XACT ABORT ON在带有事务的 SQL Server 2008R2 存储过程中因此在创建脚本中执行此操作 SET ANSI NULLS ON GO SET QUOTED IDENTIFIER ON GO SET X
使用 rvest 抓取时如何重用会话以避免重复登录？

我开发了一些代码来抓取交通数据这个话题 https stackoverflow com questions 38687068 with rvest how to extract html contents from the object r
当在 Chrome 的 Omnibox 上按下 Enter 时，Keyup 事件侦听器会触发

在 Chrome 浏览器中使用此代码片段时 document on keyup function alert Hey 每次我按下enter在网址栏中例如当我剪切并粘贴页面本身的网址时事件侦听器会触发为什么会发生这种情况 EDIT
在 V8 中使用数组（性能问题）

我尝试了下一个代码它在 Google Chrome 和 Nodejs 中显示了类似的结果 var t new Array 200000 console time wtf for var i 0 i lt 200000 i t push M
将您自己的 SQLite 数据库添加到 Android 应用程序

我们如何将自己的 SQLite 数据库添加到 android 项目中试试这个代码 public class DataBaseHelper extends SQLiteOpenHelper private Context mycontext
更改页面 url 而不刷新页面

这可能吗问题是这样的我使用此 URL 进行关键字搜索搜索后 http localhost thi search keyword key http localhost thi search keyword key 然后我有一个使用 Aj
Eclipse e4 工具装饰条中的控件

我想在装饰条中创建组合框所以我开始添加一个文本框我创建了 TrimBars gt WindowTrim gt Toolbar gt Tool Control 我还提到了 Class URI public class SearchTool
Android：如何跟踪软键盘是否打开？

在我的应用程序中设备软键盘覆盖了 EditTextView 因此用户无法看到他正在输入的内容所以我想隐藏其他视图比如我的例子中的按钮以使 EditTextViews 可见但相反做类似的事情 EditText onFocus hid
如何发送 ASP.NET Web 服务的参数

我有一个大学项目我应该在其中实现一个使用 Web 服务的 java 驱动的网站一些将创建为 servlet 另一些则应创建为 NET servlet 我创建了可以称为 loginservice username md5 的 java s
ember.js 和 bootstrap Accordion - 创建视图的“ember 方式”

我的问题不是如何使引导手风琴工作而是尝试确保我理解余烬的做事方式我在这里创建了一个引导手风琴的工作示例截至 2013 年 3 月 12 日 http jsfiddle net nrionfx s59fA http jsfiddle
如何在ggplot2中使用coord_polar移动x轴标签

我无法在下图中移动轴标签现场数据辅助数据等以便它们都很大并且完全适合图表整个代码如下关于做什么的建议 Datasource lt c Field data Participatory data Remotely sensed da
Jetpack Compose 导航 - 底部导航多个返回堆栈 - 查看模型范围问题

所以我有两个选项卡选项卡 A 和选项卡 B 每个选项卡都有自己的后堆栈我使用此中的代码实现了多个返回堆栈导航谷歌文档 https developer android com jetpack compose navigation val
对 unicode 文件使用 getline 时出现问题

更新感谢 Potatoswatter 和 Jonathan Leffler 的评论相当尴尬的是我被调试器工具提示发现没有正确显示 wstring 的值但它仍然不太适合我我已经更新了问题以下如果我有一个小的多字节文件我想读入一个

对 unicode 文件使用 getline 时出现问题

对 unicode 文件使用 getline 时出现问题 的相关文章

随机推荐

热门标签

对 unicode 文件使用 getline 时出现问题的相关文章