Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令

2023-12-05

首先,我只想在控制台中使用波罗的海字符并用它们执行 CMD 命令,但问题是从默认/标准控制台 C++ 应用程序开始的。

#include <iostream>
int main() {
    string output = "āāāčččēēēē";

    cout << output << endl;
}

早些时候,我在堆栈上提出了这个问题 -如何在 DEFAULT C++ 项目中或在 Visual Studio 2019 中使用 C++ 的 mysql 连接器时使用 UTF8 字符(Latin7_general_ci 到 UTF-8)?

我在测试中发现:如果我将 UTF8 字符串转换为 Latin1 字符串,然后 cout 或打印十六进制值,我会在控制台中输出一些特殊字符。例如 -

**char s2[256] = "\xc3\xa9";**  printed is outputted as "ķ" THAT MEANS I need to convert strings into correct HEX values when it is needed, and some people might know how it might be one.

但我的代码逻辑需要一个功能来使用此字符串在 CMD 中使用 cp。因此,稍后转换为字符串,我的 CMD 无法工作,尽管 cp 命令 CMD 必须执行的输出似乎在控制台中正确显示。

// Example program
#include <iostream>
#include <string>
#include <fstream>
#include <sstream> 
#include <stdexcept>
#include <stdlib.h> 
#include <stdio.h> 
#include <time.h> 
#include <cstring> 
#include <cstdint>
#include <locale> 
#include <cstdlib>





int GetUtf8CharacterLength(unsigned char utf8Char)
{
    if (utf8Char < 0x80) return 1;
    else if ((utf8Char & 0x20) == 0) return 2;
    else if ((utf8Char & 0x10) == 0) return 3;
    else if ((utf8Char & 0x08) == 0) return 4;
    else if ((utf8Char & 0x04) == 0) return 5;

    return 6;
}

char Utf8ToLatin1Character(char* s, int* readIndex)
{
    int len = GetUtf8CharacterLength(static_cast<unsigned char>(s[*readIndex]));
    if (len == 1)
    {
        char c = s[*readIndex];
        (*readIndex)++;

        return c;
    }

    unsigned int v = (s[*readIndex] & (0xff >> (len + 1))) << ((len - 1) * 6);
    (*readIndex)++;
    for (len--; len > 0; len--)
    {
        v |= (static_cast<unsigned char>(s[*readIndex]) - 0x80) << ((len - 1) * 6);
        (*readIndex)++;
    }

    return (v > 0xff) ? 0 : (char)v;
}

// overwrites s in place
char* Utf8ToLatin1String(char* s)
{
    for (int readIndex = 0, writeIndex = 0; ; writeIndex++)
    {
        if (s[readIndex] == 0)
        {
            s[writeIndex] = 0;
            break;
        }

        char c = Utf8ToLatin1Character(s, &readIndex);
        if (c == 0)
        {
            c = '_';
        }

        s[writeIndex] = c;
    }

    return s;
}


int main()
{
    char s2[256] = "\xc3\xa9";
    Utf8ToLatin1String(s2);

    std::cout << s2 << std::endl;

    std::string locations2 = ("C:\\Users\\Janis\\Desktop\\TEST2\\");
    std::string txtt = (".txt");
    std::string copy2 = ("copy /-y ");

    std::string space = " ";
    std::string PACIENTI2 = "C:\\PACIENTI\\";




    std::string element = copy2 + locations2 + s2 + txtt;

    std::string cmd = element + space + PACIENTI2 + s2 + txtt;

    std::cout << cmd << std::endl;

    FILE* pipe = _popen(cmd.c_str(), "r");
}

所以我们需要真正解决两个问题,从已经给定的十六进制字符串创建,并确保它在 CMD 中工作。


我在你的另一个问题中已经给你提供了很好的答案。这是类似的东西。

你的程序可以使用UTF-8编码和控制台可以使用不同的编码,但是您必须向标准库提供如何对每个数据源进行编码的提示。
当然,如果目标编码没有涵盖不支持特定字符,则必须启动一些后备(请参见底部的示例)。

必须明确定义编码才能使一切正常工作的 4 个领域:

  • 你的源代码。 VS 使用系统区域设置来使用编码,这很糟糕。强制 VS 和所有编辑器使用通用编码,UTF-8 选择是最好的。最好告知编译器源代码是如何编码的:cl /source-charset:utf-8 .....
  • 你的可执行文件。您必须定义在最终可执行文件中应编码哪种编码字符串文字。这里UTF-8也是最好的:cl .... /execution-charset:utf-8 .....
  • 当您运行应用程序时,您必须告知标准库您的字符串文字定义的编码类型或程序逻辑中使用的编码类型。因此,在执行开始时,代码中的某个位置需要这样的内容:
std::locale::global(std::locale{".utf-8"});
  • 最后你必须指示流应该使用哪种编码。因此对于std::cout and std::cin您应该设置系统默认的区域设置:
    auto streamLocale = std::locale{""}; 
    // this impacts date/time/floating point formats, so you may want tweak it just to use sepecyfic encoding and use C-loclae for formating
    std::cout.imbue(streamLocale);
    std::cin.imbue(streamLocale);

之后,一切都应该按预期工作,无需显式进行转换的代码。
由于有 4 个地方会出错,这就是人们遇到麻烦的原因,并且互联网上充满了“黑客”解决方案。

这是一些测试程序来证明我的观点:

#include <iostream>
#include <locale>
#include <exception>
#include <string>

void setupLocale(int argc, const char *argv[])
{
    std::locale def{""};
    std::locale::global(argc > 1 ? std::locale{argv[1]} : def);
    auto streamLocale = argc > 2 ? std::locale{argv[2]} : def;
    std::cout.imbue(streamLocale);
    std::cin.imbue(streamLocale);
}

void printSeparator()
{
    std::cout << "---------\n";
}

void printTestStuff()
{
    std::cout << "Wester Europe: āāāčččēēēēßÞÖöñÅÃ\n";
    std::cout << "Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă\n";
    std::cout << "China: 字集碼是把字符集中的字符编码为指定集合中某一对象\n";
    std::cout << "Korean: 줄여서 인코딩은 사용자가 입력한\n";
}

int main(int argc, const char *argv[]) {
    try{
        setupLocale(argc, argv);
        printSeparator();
        printTestStuff();
        printSeparator();
    }
    catch(const std::exception& e)
    {
        std::cerr << e.what() << '\n';
    }
}

以及它是如何构建和运行以显示其工作原理的(请注意,这也涵盖了使用无效编码的情况):

C:\Users\User\Downloads>cl /source-charset:utf-8 /execution-charset:utf-8 /EHsc encodings.cpp
Microsoft (R) C/C++ Optimizing Compiler Version 19.28.29336 for x86
Copyright (C) Microsoft Corporation.  All rights reserved.

encodings.cpp
Microsoft (R) Incremental Linker Version 14.28.29336.0
Copyright (C) Microsoft Corporation.  All rights reserved.

/out:encodings.exe
encodings.obj

C:\Users\User\Downloads>chcp
Active code page: 437

C:\Users\User\Downloads>encodings.exe
---------
Wester Europe: Ä?Ä?Ä?Ä?Ä?Ä?Ä"Ä"Ä"Ä"AYAzA-AA±A.Aƒ
Central Europe: Ä.Ä,A"A3Å?Å,Ä~ÄTżÄ╪źŰűA?A½Ä,ă
China: å--é>+碼æ~_æSSå--ç¬▌é>+ä,-çs,å--ç¬▌ç¼-ç ?ä,ºæO╪årsé>+å?^ä,-æY?ä,?å_1象
Korean: ì,ì-¬ì,o ì?,ì½"ë"cì?? ì,¬ìscìz?ê°? ìz.ë ¥ío
---------

C:\Users\User\Downloads>encodings.exe .65001
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>encodings.exe .65001 .437
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>encodings.exe .65001 .1250
---------
Wester Europe: aaaccceeeeß_ÖöñÅA
Central Europe: aAOóLlEezczUuYyAa
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>chcp 1250
Active code page: 1250

C:\Users\User\Downloads>encodings.exe .65001 .1250
---------
Wester Europe: aaačččeeeeß?ÖönAA
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: ????????????????????????
Korean: ??? ???? ???? ???
---------

C:\Users\User\Downloads>chcp 65001
Active code page: 65001

C:\Users\User\Downloads>encodings.exe
---------
Wester Europe: ÄÄÄÄÄÄēēēēßÞÖöñÅÃ
Central Europe: ąĄÓóÅłĘężćźŰűÃýĂă
China: 字集碼是把字符集中的字符编ç ä¸ºæŒ‡å®šé›†åˆä¸­æŸä¸€å¯¹è±¡
Korean: 줄여서 ì¸ì½”ë”©ì€ ì‚¬ìš©ìžê°€ 입력한
---------

C:\Users\User\Downloads>encodings.exe .65001
---------
Wester Europe: āāāčččēēēēßÞÖöñÅÃ
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: 字集碼是把字符集中的字符编码为指定集合中某一对象
Korean: 줄여서 인코딩은 사용자가 입력한
---------

C:\Users\User\Downloads>encodings.exe .65001 .65001
---------
Wester Europe: āāāčččēēēēßÞÖöñÅÃ
Central Europe: ąĄÓóŁłĘężćźŰűÝýĂă
China: 字集碼是把字符集中的字符编码为指定集合中某一对象
Korean: 줄여서 인코딩은 사용자가 입력한
---------

C:\Users\User\Downloads>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令 的相关文章

  • Unix网络编程澄清

    我正在翻阅这本经典书籍Unix网络编程 https rads stackoverflow com amzn click com 0139498761 当我偶然发现这个程序时 第 6 8 节 第 179 180 页 include unp h
  • 如何检查QProcess是否正确执行?

    QProcess process sdcompare QString command sdcompare QStringList args sdcompare command sdcompare diff args sdcompare lt
  • 启动时出现 OData v4 错误:找不到段“Whatever”的资源

    我正在构建新的 v4 服务 一切进展顺利 直到我为新模型 实体添加了新控制器 并在启动站点进行测试运行时收到此错误 控制器似乎编码正确 就像其他控制器一样 控制器 CustomersOData 中的操作 GetFeed 上的路径模板 Cus
  • 检测/删除 Python 2 + GTK 中不成对的代理字符

    在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
  • 将内置类型转换为向量

    我的 TcpClient 类接受vector
  • 互斥体实现可以互换(独立于线程实现)

    所有互斥体实现最终都会调用相同的基本系统 硬件调用吗 这意味着它们可以互换吗 具体来说 如果我使用 gnu parallel算法 使用openmp 并且我想让他们称之为线程安全的类我可以使用boost mutex用于锁定 或者我必须编写自己
  • C++中的类查找结构体数组

    我正在尝试创建一个结构数组 它将输入字符串链接到类 如下所示 struct string command CommandPath cPath cPathLookup set an alarm AlarmCommandPath send an
  • 生成(非常)大的非重复整数序列而不进行预洗牌

    背景 我编写了一个简单的媒体客户端 服务器 我想生成一个不明显的时间值 随从客户端到服务器的每个命令一起发送 时间戳中将包含相当多的数据 纳秒分辨率 即使它不是真正准确 因为现代操作系统中计时器采样的限制 等 我想做的 在 Linux 上
  • 如何在 Linq 中获得左外连接?

    我的数据库中有两个表 如下所示 顾客 C ID city 1 Dhaka 2 New york 3 London 个人信息 P ID C ID Field value 1 1 First Name Nasir 2 1 Last Name U
  • 单击 form2 上的按钮触发 form 1 中的方法

    我对 Windows 窗体很陌生 我想知道是否可以通过单击表单 2 中的按钮来触发表单 1 中的方法 我的表格 1 有一个组合框 我的 Form 2 有一个 保存 按钮 我想要实现的是 当用户单击表单 2 中的 保存 时 我需要检查表单 1
  • C++:.bmp 到文件中的字节数组

    是的 我已经解决了与此相关的其他问题 但我发现它们没有太大帮助 他们提供了一些帮助 但我仍然有点困惑 所以这是我需要做的 我们有一个 132x65 的屏幕 我有一个 132x65 的 bmp 我想遍历 bmp 并将其分成小的 1x8 列以获
  • 如何使用 Mongodb C# 驱动程序连接多个集合

    我需要将 3 个集合与多个集合合并在一起 lookup我在 C 驱动程序中尝试过 它允许我 lookup用户采集但无法执行秒 lookup用于设置集合 有人可以帮忙吗 db Transactions aggregate lookup fro
  • 将 log4net 与 Autofac 结合使用

    我正在尝试将 log4net 与 Autofac 一起使用 我粘贴了这段代码http autofac readthedocs org en latest examples log4net html http autofac readthed
  • std::async 与重载函数

    可能的重复 std bind 重载解析 https stackoverflow com questions 4159487 stdbind overload resolution 考虑以下 C 示例 class A public int f
  • C++ 密码屏蔽

    我正在编写一个代码来接收密码输入 下面是我的代码 程序运行良好 但问题是除了数字和字母字符之外的其他键也被读取 例如删除 插入等 我知道如何避免它吗 特q string pw char c while c 13 Loop until Ent
  • 如何在 C# 中调整图像大小同时保持高质量?

    我从这里找到了一篇关于图像处理的文章 http www switchonthecode com tutorials csharp tutorial image editing saving cropping and resizing htt
  • 有没有办法强制显示工具提示?

    我有一个验证字段的方法 如果无法验证 该字段将被清除并标记为红色 我还希望在框上方弹出一个工具提示 并向用户显示该值无效的消息 有没有办法做到这一点 并且可以控制工具提示显示的时间 我怎样才能让它自己弹出而不是鼠标悬停时弹出 If the
  • memset 未填充数组

    u32 iterations 5 u32 ecx u32 malloc sizeof u32 iterations memset ecx 0xBAADF00D sizeof u32 iterations printf 8X n ecx 0
  • Linq-to-entities,在一个查询中获取结果+行数

    我已经看到了有关此事的多个问题 但它们已经有 2 年 或更长 的历史了 所以我想知道这方面是否有任何变化 基本思想是填充网格视图并创建自定义分页 所以 我还需要结果和行数 在 SQL 中 这将类似于 SELECT COUNT id Id N
  • 当另一个线程可能设置共享布尔标志(最多一次)时,是否可以读取共享布尔标志而不锁定它?

    我希望我的线程能够更优雅地关闭 因此我尝试实现一个简单的信号机制 我不认为我想要一个完全事件驱动的线程 所以我有一个工作人员有一种方法可以使用关键部分优雅地停止它Monitor 相当于C lock我相信 绘图线程 h class Drawi

随机推荐