在 C++ 中读取和写入西里尔文文件

2023-12-06

我必须首先读取西里尔文文件，然后随机选择随机行数并将修改后的文本写入不同的文件。拉丁字母没有问题，但我遇到了西里尔文字的问题，因为我得到了一些垃圾。这就是我尝试做这件事的方式。

说，归档input.txt is

ааааааа
ббббббб
ввввввв

我必须阅读它，并将每一行放入向量中：

vector<wstring> inputVector;
wstring inputString, result;
wifstream inputStream;
inputStream.open("input.txt");
while(!inputStream.eof())
{
    getline(inputStream, inputString);              
    inputVector.push_back(inputString);
}
inputStream.close();    

srand(time(NULL));
int numLines = rand() % inputVector.size();
for(int i = 0; i < numLines; i++)
{
    int randomLine = rand() % inputVector.size();
    result += inputVector[randomLine];
}

wofstream resultStream;
resultStream.open("result.txt");
resultStream << result;
resultStream.close();

那么我怎样才能使用西里尔字母来生成可读的东西，而不仅仅是符号呢？

因为您看到类似 ■a a a a a a a 1 1 1 1 1 1 1 2 2 2 2 2 2 2 ♦ 打印到控制台，看起来input.txt以 UTF-16 编码进行编码，可能是 UTF-16 LE +BOM。如果将文件的编码更改为 UTF-8，则可以使用原始代码。

使用UTF-8的原因是，无论文件流的char类型如何，basic_fstream的底层basic_filebuf uses a codecvt转换流的对象char与 char 类型对象流之间的对象；即在阅读时，char从文件中读取的流被转换为wchar_t流，但是在写入时，wchar_t流被转换为char然后写入文件的流。如果是std::wifstream, the codecvt对象是标准的一个实例std::codecvt<wchar_t, char, mbstate_t>，通常将 UTF-8 转换为 UCS-16。

正如上所解释的MSDN 文档页面basic_filebuf:

类型对象基本文件缓冲区使用 char * 类型的内部缓冲区创建，无论字符类型由类型参数指定Elem。这意味着 Unicode 字符串（包含 wchar_t 字符）在写入内部缓冲区之前将被转换为 ANSI 字符串（包含 char 字符）。

类似地，当读取 Unicode 字符串（包含wchar_t字符），basic_filebuf将从文件中读取的 ANSI 字符串转换为wchar_t字符串返回到getline和其他读取操作。

如果你改变编码input.txt转换为 UTF-8，您的原始程序应该可以正常工作。

作为参考，这对我有用：

#include <cstdlib>
#include <ctime>
#include <fstream>
#include <iostream>
#include <string>
#include <vector>

int main()
{
    using namespace std;

    vector<wstring> inputVector;
    wstring inputString, result;
    wifstream inputStream;
    inputStream.open("input.txt");
    while(!inputStream.eof())
    {
        getline(inputStream, inputString);
        inputVector.push_back(inputString);
    }
    inputStream.close();

    srand(time(NULL));
    int numLines = rand() % inputVector.size();
    for(int i = 0; i < numLines; i++)
    {
        int randomLine = rand() % inputVector.size();
        result += inputVector[randomLine];
    }

    wofstream resultStream;
    resultStream.open("result.txt");
    resultStream << result;
    resultStream.close();

    return EXIT_SUCCESS;
}

请注意，编码result.txt也将是 UTF-8（通常）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 C++ 中读取和写入西里尔文文件的相关文章

尝试了解使用服务打开对话框

我已经阅读了有关使用 mvvm 模式打开对话框的讨论我看过几个使用服务的示例但我不明白所有部分如何组合在一起我发布这个问题寻求指导以了解我应该阅读哪些内容以更好地理解我所缺少的内容我将在下面发布我所拥有的内容它确实有效但从我
Rx.NET 中是否有一个Subject 实现，其功能类似于BehaviourSubject，但仅在值发生更改时才发出？

有没有Subject https learn microsoft com en us previous versions dotnet reactive extensions hh229699 v vs 103 Rx NET 中的实现在功能
转换 const void*

我有一个函数返回一个const void 我想用它的信息作为char 我可以将它投射为 C 风格的罚款 char variable但是当我尝试使用reinterpret cast like reinterpret cast
前向声明类型和“已声明为类类型的非类类型”

我对以下代码有问题 template
有些有助于理解“产量”

在我不断追求少吸的过程中我试图理解产量的说法但我不断遇到同样的错误 someMethod 的主体不能是迭代器块因为 System Collections Generic List 不是迭代器接口类型这是我被卡住的代码 forea
处理右值时的 insert 与 emplace

std string myString std unordered set
在 C# 中检查 PowerShell 执行策略的最佳方法是什么？

当你跑步时Get ExecutionPolicy在 PowerShell 中它得到有效的执行政策 https learn microsoft com en us powershell module microsoft powershell
是否使用 C# 数据集？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我对 C 中的数据集概念有点困惑编码 ASP NET 站点但这并不重要在我的阅读中我了解到它们本质上用作我的应用程序和我的
从网页运行 ClickOnce 应用程序，无需用户操作

我们有一个基于 Java 的 Web 应用程序以及用 C 编写的相同应用程序如果 java 检查器发现客户端计算机上没有安装 Java 则应该运行该应用程序这个想法是运行 C 单击一次 http en wikipedia org wik
从 C# 使用 Odbc 调用 Oracle 包函数

我在 Oracle 包中定义了一个函数 CREATE OR REPLACE PACKAGE BODY TESTUSER TESTPKG as FUNCTION testfunc n IN NUMBER RETURN NUMBER as be
禁用复选框上的输入

需要在取消选中该复选框时禁用输入并在选中该复选框时启用它我的代码是这样的 div class y div
模板外部链接？谁能解释一下吗？

模板名称具有链接 3 5 非成员函数模板可以有内部链接任何其他模板名称应具有外部链接从具有内部链接的模板生成的实体与在其他翻译单元中生成的所有实体不同我知道使用关键字的外部链接 extern C EX extern C templat
在 C# 中为父窗体中的子窗体控件添加事件处理程序

我有两种形式一种是带有按钮和文本框的父表单单击该按钮时将打开一个对话框该子窗体又包含一个文本框和一个按钮现在我想要的是每当子表单文本框中的文本更改时父表单文本框中的文本会自动更改为了获得这个我所做的是 Form3 f3 n
C++ - 多维数组

处理多维数组时是否可以为数组分配两种不同的变量类型例如你有数组int example i j 有可能吗i and j是两种完全不同的变量类型例如 int 和 string 听起来您正在寻找 std vector
将二变量 std::function 转换为单变量 std::function

我有一个函数它获取两个值 x 和 y 并返回结果 std function lt double double double gt mult double x double y return x y 现在我想得到一个常量 y 的单变量函数
将 Word 转换为 PDF - 禁用“保存”对话框

我有一个用 C 编写的 Word 到 PDF 转换器除了一件事之外它工作得很好有时在某些 Word 文件上后台会出现一条消息保存源文件中的更改 gt 是否取消但我没有对源文件进行任何更改我只想从 Word 文件创建 PDF
将函数参数类型提取为参数包

这是一个后续问题解包元组以调用匹配的函数指针 https stackoverflow com questions 7858817 unpacking a tuple to call a matching function pointer
C++ 对象用 new 创建，用 free() 销毁；这有多糟糕？

我正在修改一个相对较大的 C 程序不幸的是并不总是清楚我之前的人使用的是 C 还是 C 语法这是在一所大学的电气工程系我们 EE 总是想用 C 来做所有事情不幸的是在这种情况下人们实际上可以逃脱惩罚但是如果有人创建一个对象
C++：二叉树所有节点值的总和

我正在准备面试我被一个二叉树问题困住了我们如何计算二叉树所有节点中存在的值的总和优雅的递归解决方案伪代码 def sum node if node NULL return 0 return node gt value sum nod
在 System.Type 上使用条件断点时出错

这是函数 public void Init System Type Type this Type Type BuildFieldAttributes BuildDataColumns FieldAttributes 我在第一行设置了一个断点

随机推荐

如何在checkboxlisttile中选择flutter中的多个复选框

谁能告诉我如何在 checkboxlisttile 中选择多个选项在这里我只能单击一个选项当我检查特定项目时我想将数据库中注释表中的状态列设置为已完成实际上我想选择已完成的项目并将其显示在另一个名为已完成的选项卡下 check
如何根据连接数组的值选择 INNER JOIN 表的列

我在本地服务器中使用 phpMyAdmin 创建了一个 mySQL 数据库在这个数据库中我存储了我朋友的名字和最喜欢的NBA球队这显然是多对多的关系因此我在 MySQL 中运行以下脚本来为此数据库创建适当的表 CREATE TABL
当我尝试打印幂函数的结果时，我总是得到 0

我是 C 初学者当我尝试编写一些这样的代码时 printf n Answer d n 12 pow 2 1 我总是得到答案 0 但是当我像这样写成浮点数时 printf n Answer f n 12 pow 2 1 我得到答案 24
下划线字符串模型活页夹

我的印象是当绑定到复杂模型时所有公共属性都会被处理并尝试为每个属性进行匹配绑定我正在尝试解决变量命名问题以便模型 class Model public string Foo get set public string FooBar
使用 RestTemplate 进行基本身份验证 - 编译错误 - 构造函数 HttpClient() 不可见

尝试将基本身份验证添加到restTemplate 我遇到的问题是我无法初始化代码片段中都有导入 HttpClient client new HttpClient 此代码解决了编译错误 Eclipse 没有提供解决此问题的建议 1 问题是什
Fortran 中内在函数fraction() 的错误输出

例如我不明白 FRACTION 的输出 write fraction 553 334 它给了我0 5403652 我以为它应该回来0 334 as 553 334 floor 553 334 做我的理解有什么问题吗相反该值正是在可
将 props 传递给高阶组件

我有一个高阶组件FormBuilder像这样 const FormBuilder WrappedComponent gt return class HOC extends React Component clearForm render r
C++ 中未声明的字符串

我确信这是一件非常简单的事情但我并没有永远使用 C 14 C Dev Cpp mainCurl cpp 字符串未声明首先使用此功能 gt include
Delphi客户端-服务器应用程序使用Firebird 2.5嵌入连接错误

我有一个很长的问题要问首先我对 Delphi 编程还很陌生我的经验主要是使用 ADO 和 Access 数据库开发小型单用户数据库应用程序我现在需要转换到客户端服务器应用程序这就是问题开始的地方我决定使用 Firebird 2
单击链接按钮时不会触发中继器的项目命令事件

我的中继器的 OnItemCommand 事件有问题当我单击链接按钮时它不会触发我是否缺少任何环境变量 ASPX代码 table table
表内每条记录都有一个堆栈面板

对于每个record 姓名年龄城市电子邮件 table 我需要有one stack panel 见下图stack panel天蓝色并添加这样的列表stack panel in to dock panel 见下图dock panel
如果使用 WebApiThrottle 超出 API 速率限制，则阻止 API 请求 5 分钟 - C# Web API

有一个非常好的图书馆WebApi节流用于 Web API 中的 API 速率限制正如 Wiki 页面上提到的我可以根据 API 调用的授权令牌标头对 API 进行速率限制但是如果超过此 api 速率限制如何在接下来的 5 分钟内阻
为什么重载函数声明有时会强制无用的类型缩小？

给出重载函数语句的以下实现 function foo options a a function foo options b b function foo options a b a b switch options case a retur
如何在 Selenium Python 中设置用户代理客户端提示 sec-ch-ua

我运行此代码在 Selenium Python 中设置 User Agent Client Hint sec ch ua 但它仍然没有改变 from selenium webdriver import Chrome from seleniu
如何将Firefox和Chrome添加到C#浏览器控件中？

您能否告诉我如何将 Chrome Firefox 等其他浏览器控件添加到 C Web 浏览器控件中我正在尝试用 C 创建一个 HTML 和 CSS 规则测试器我需要将它们全部包含在应用假设您只想使用其他浏览器而不是将 Chrome
清理一个fork并从上游重新启动它

我分叉了一个存储库然后做了一些更改看起来我已经搞砸了一切我希望从头开始使用当前的上游主控作为我工作的基础我应该重新设置我的存储库还是完全删除它最简单的解决方案是使用 upstream 作为引用原始存储库分叉的远程名称 git
Laravel 6 config()->get('database.connections.mysql') 不匹配 DB:connection()

先决条件在我的本地环境中我正在与多个租户和 Redis 合作需要身份验证为了服务这个项目我正在使用 Valet 对于这种情况我将解决这两个连接 basic foo is defined in my env tenant foo
具有多种货币价格的 Schema.org 产品

我正在尝试设置Schema org目前网站上有元数据我想知道如何或是否声明多种货币我有 6 种价格格式英镑美元和欧元均包含费用和前增值税价格根据产品页面上 Schema 提供的示例只有 1 个价格是否可以指定更多价格
温莎城堡无法在中等信任下运行

尝试运行使用 Castle Windsor 的 ASP NET MVC 应用程序时出现以下错误应用程序中的服务器错误重写成员时违反了继承安全规则 Castle MicroKernel DefaultKernel InitializeL
在 C++ 中读取和写入西里尔文文件

我必须首先读取西里尔文文件然后随机选择随机行数并将修改后的文本写入不同的文件拉丁字母没有问题但我遇到了西里尔文字的问题因为我得到了一些垃圾这就是我尝试做这件事的方式说归档input txt is 我必须阅读它并将每一行放入向

在 C++ 中读取和写入西里尔文文件

在 C++ 中读取和写入西里尔文文件 的相关文章

随机推荐

热门标签

在 C++ 中读取和写入西里尔文文件的相关文章