字符串比较。如何将字符串与 std::wstring 进行比较? WRT STRCMP

2024-04-22

我试图比较两种我期望在某种程度上兼容的格式,因为它们通常都是字符串。我尝试使用字符串和 std::wstring 执行 strcmp,并且我确信 C++ 专家知道,这根本无法编译。是否可以比较这两种类型?这里有简单的转换吗?


你需要转换你的char*字符串 - ISO C 术语中的“多字节” - 到 awchar_t*string - ISO C 术语中的“宽字符”。执行此操作的标准函数称为mbstowcs http://www.kernel.org/doc/man-pages/online/pages/man3/mbstowcs.3.html(“多字节字符串到宽字符串”)

NOTE:正如 Steve 在评论中指出的那样,这是一个 C99 函数,因此不符合 ISO C++ 标准,但可能作为扩展得到 C++ 实现的支持。 MSVC 和 g++ 都支持它。

它的用法如下:

const char* input = ...;

std::size_t output_size = std::mbstowcs(NULL, input, 0); // get length
std::vector<wchar_t> output_buffer(output_size);

// output_size is guaranteed to be >0 because of \0 at end
std::mbstowcs(&output_buffer[0], input, output_size);

std::wstring output(&output_buffer[0]);

一旦你有两个wstrings,照常比较即可。请注意,这将使用当前系统区域设置进行转换(即在 Windows 上,这将是当前的“ANSI”代码页) - 通常这正是您想要的,但有时您需要处理特定的编码,在这种情况下上面的方法不行,你需要使用类似的东西iconv.

EDIT

所有其他答案似乎都适用于直接代码点翻译(即相当于(wchar_t)c对于每一个char c在字符串中)。这可能不适用于所有区域设置,但如果例如你的char都是 ASCII 或 Latin-1,并且你的wchar_t是统一码。如果您确定这就是您真正想要的,最快的方法实际上是完全避免转换,并使用std::lexicographical_compare:

#include <algorithm>

const char* s = ...;
std::wstring ws = ...;

const char* s_end = s + strlen(s);

bool is_ws_less_than_s = std::lexicographical_compare(ws.begin, ws.end(),
                                                      s, s_end());
bool is_s_less_than_ws = std::lexicographical_compare(s, s_end(),
                                                      ws.begin(), ws.end());
bool is_s_equal_to_ws = !is_ws_less_than_s && !is_s_less_than_ws;

如果您特别需要测试相等性,请使用std::equal进行长度检查:

#include <algorithm>

const char* s = ...;
std::wstring ws = ...;

std::size_t s_len = strlen(s);
bool are_equal =
    ws.length() == s_len &&
    std::equal(ws.begin(), ws.end(), s);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

字符串比较。如何将字符串与 std::wstring 进行比较? WRT STRCMP 的相关文章

随机推荐