使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？

2023-12-20

按照我之前的问题：尽管手册页有免责声明，为什么“strchr”似乎可以使用多字节字符？ https://stackoverflow.com/q/25566356/3194340，我发现strchr是一个糟糕的选择。

相反，我正在考虑使用strstr寻找单个字符（多字节不是char):

const char str[] = "This string contains é which is a multi-byte character";
char * pos = strstr(str, "é"); // 'é' = 0xC3A9: 2 bytes 
printf("%s\n", pos);

Ouput:

é 是一个多字节字符

这就是我所期望的：多字节字符的第一个字节的位置。

先验地，这不是规范的用法strstr但似乎效果很好。
这个解决方法安全吗？您能想到会导致错误的任何副作用或特殊情况吗？

[EDIT]:我应该明确表示我不想使用wchar_t类型并且我处理的字符串是 UTF-8 编码的（我知道这一点choice http://utf8everywhere.org/可以讨论，但这是一个无关紧要的辩论）

Edit
基于 OP 的更新问题“UTF-8 上下文中是否存在这种误报” 因此，答案是 UTF-8 的设计方式使其不会受到如上所示的字符部分不匹配的影响并导致任何误报。所以使用起来完全安全strstr带有 UTF-8 编码的多字节字符。

原答案
No strstr不适合包含多字节字符的字符串。

如果您在包含多字节字符的字符串中搜索不包含多字节字符的字符串，则可能会出现误报。（使用时Shift-jis 编码 http://www.rtpro.yamaha.co.jp/RT/docs/misc/kanji-sjis.html在日语语言环境中， strstr("掘某事", "@some") 可能会给出误报）

+---------+----+----+----+
|   c1    | c2 | c3 | c4 |  <--- string
+---------+----+----+----+

     +----+----+----+
     | c5 | c2 | c3 |  <--- string to search
     +----+----+----+

如果 c1 的尾随部分（意外地）与 c5 匹配，您可能会得到不正确的结果。我建议使用 unicode 和 unicode 子字符串检查函数或多字节子字符串检查函数。（_mbsstr http://msdn.microsoft.com/en-us/library/z9da80kz.aspx例如）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？的相关文章

如何在 VC++ CString 中验证有效的整数和浮点数

有人可以告诉我一种有效的方法来验证 CString 对象中存在的数字是有效整数还是浮点数吗 Use tcstol http msdn microsoft com en us library w4z2wdyc aspx and tcstod
尝试了解使用服务打开对话框

我已经阅读了有关使用 mvvm 模式打开对话框的讨论我看过几个使用服务的示例但我不明白所有部分如何组合在一起我发布这个问题寻求指导以了解我应该阅读哪些内容以更好地理解我所缺少的内容我将在下面发布我所拥有的内容它确实有效但从我
如何在类文件中使用 Url.Action() ？

如何在 MVC 项目的类文件中使用 Url Action Like namespace 3harf public class myFunction public static void CheckUserAdminPanelPermissi
打印“X”个字符数与“X”字符串长度的所有可能组合（暴力破解）

我正在尝试编写一个单词组合生成器我的意思是打印 X 个字符数与 X 字符串长度的所有可能组合首先我需要说的是我在 StackOverFlow 中看到了一个关于这个问题的问题其中有很多单词生成器的答案来执行此操作在不同的语言上但
循环遍历 C 结构中的元素以提取单个元素的值和数据类型

我有一个要求我有一个 C 语言的大结构由大约 30 多个不同数据类型的不同元素组成 typedef struct type1 element1 type2 element2 type3 element3 type2 element4 1
有些有助于理解“产量”

在我不断追求少吸的过程中我试图理解产量的说法但我不断遇到同样的错误 someMethod 的主体不能是迭代器块因为 System Collections Generic List 不是迭代器接口类型这是我被卡住的代码 forea
cpp.react库的C++源代码中奇怪的“->* []”表达式

这是我在文档中找到的 C 片段cpp react 库 https github com schlangster cpp react implicit parallelism auto in D MakeVar 0 auto op1 in g
如何在 C# Designer.cs 代码中使用常量字符串？

如何在 designer cs 文件中引用常量字符串一个直接的答案是在我的 cs 文件中创建一个私有字符串变量然后编辑 Designer cs 文件以使用此变量而不是对字符串进行硬编码但设计者不喜欢这样抛出错误我明白为什么这行不通
如何使用 ASP.NET Core 获取其他用户的声明

我仍在学习 ASP NET Core 的身份我正在进行基于声明的令牌授权大多数示例都是关于当前登录用户的就我而言我的 RPC 服务正在接收身份数据库中某个用户的用户名和密码我需要验证是否存在具有此类凭据的用户获取该用户的所
在 C# 中检查 PowerShell 执行策略的最佳方法是什么？

当你跑步时Get ExecutionPolicy在 PowerShell 中它得到有效的执行政策 https learn microsoft com en us powershell module microsoft powershell
是否使用 C# 数据集？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我对 C 中的数据集概念有点困惑编码 ASP NET 站点但这并不重要在我的阅读中我了解到它们本质上用作我的应用程序和我的
从网页运行 ClickOnce 应用程序，无需用户操作

我们有一个基于 Java 的 Web 应用程序以及用 C 编写的相同应用程序如果 java 检查器发现客户端计算机上没有安装 Java 则应该运行该应用程序这个想法是运行 C 单击一次 http en wikipedia org wik
在 .NET MAUI 中实现 TouchTracking

我一直致力于将我们的应用程序从 Xamarin Forms 迁移到 NET MAUI 我们的应用程序几乎没有绘图功能用户可以用手指进行绘图我们用了TouchTrackingXamarin Forms 中的 nuget 包但与 NET
如何递归取消引用指针（C++03）？

我正在尝试在 C 中递归地取消引用指针如果传递一个对象那就是not一个指针这包括智能指针我只想返回对象本身如果可能的话通过引用返回我有这个代码 template
从 C# 使用 Odbc 调用 Oracle 包函数

我在 Oracle 包中定义了一个函数 CREATE OR REPLACE PACKAGE BODY TESTUSER TESTPKG as FUNCTION testfunc n IN NUMBER RETURN NUMBER as be
不可变类与结构

以下是类与 C 中的结构的唯一区别如果我错了请纠正我类变量是引用而结构变量是值因此在赋值和参数传递中复制结构的整个值类变量是存储在堆栈上的指针指向堆上的内存而结构变量作为值存储在堆上假设我有一个不可变的结构该结构的字段一
如何在 C# 中创建异步方法？

我读过的每一篇博客文章都会告诉您如何在 C 中使用异步方法但由于某些奇怪的原因从未解释如何构建您自己的异步方法来使用所以我现在有这段代码使用我的方法 private async void button1 Click object se
Oauth2中如何同时撤销RefreshToken和使AccessToken失效

我正在使用 Owin Oauth2 授权和资源服务器相同开发单页面应用程序 AngularJS Net MVC Json Rest API 的身份验证流程我选择了 Bearer Token 路由而不是传统的 cookie session
在 System.Type 上使用条件断点时出错

这是函数 public void Init System Type Type this Type Type BuildFieldAttributes BuildDataColumns FieldAttributes 我在第一行设置了一个断点
如何在 C 中将 char 连接到 char* ？

我怎样才能前置char c to char myChar 我有c值为 A and myChar值为 LL 我怎样才能前置c to myChar使 ALL 这应该有效 include

随机推荐

Angularjs，对表中选定的复选框应用操作

我正在尝试学习 AngularJS 并实现此复选框当我从网格中选择一些复选框并单击删除按钮时应从选定的复选框中删除表中的数据我尝试过但不知道如何实现它请参阅我在 Plunker 上的这段代码 http plnkr co edit
为什么 SELECT FOR UPDATE 只能在事务中起作用？

我想我很困惑选择更新 https dev mysql com doc refman 5 0 en innodb locking reads html构造例子 mysql gt select from employees2 EmpId Em
msm 包中出现错误：*** 捕获段错误 *** “内存未映射”

我正在尝试使用 msm 包运行多状态模型但遇到以下错误 caught segfault address 0x607c00032c60 cause memory not mapped The data dat long lt structu
如何使用 JavaScript 来限制最小值/最大值之间的数字？

我想限制两个值之间的数字我知道在 PHP 中你可以这样做 number min max intval number 1 20 this will make number 1 if it s lower than 1 and 20 if i
即使所选选项没有更改，是否有任何方法可以在 Chrome 中的 SELECT 元素上触发单击事件？

我有一个 SELECT 元素其内容选项元素通过 AJAX 加载并在准备就绪时以及更改不同的 SELECT 时插入两个 SELECT 都有两个 OPTION 元素附加到通过 AJAX 加载的元素列表中
PHP Pthreads 最新版本 3.1.6（64 位）未安装在 Apache 上

我正在尝试为 PHP 安装最新的 pthreads 扩展 3 1 6 64 位根据 pthreads 的作者建议 http github com krakjoe pthreads http github com krakjoe pthre
何时支持 ng-if 与 ng-show/ng-hide？

我明白那个ng show and ng hide影响元素上设置的类ng if控制元素是否呈现为 DOM 的一部分有没有选择指南ng if over ng show ng hide或相反亦然取决于您的用例但总结一下差异 ng if将从
在字头表中添加页码 C#

我在word中创建了一个1x3表格作为我的标题这就是我想要的样子左侧文本中间文本页码我希望 PageNumber 单元格看起来像这样页码 X Y 我已经成功地完成了单元格 1 1 和 1 2 我发现这可以帮助我处理单元格 1 3
如何从 getc 读取过去的 EOF？

我正在编写一个 XOR 加密程序该程序在加密期间工作正常但在解密期间工作正常这 char ca2 fgetc f 被卡在某一点并且之后不会发生解密我对问题的最好猜测是加密文件包含各种字符一旦 fgetc 到达 EOF 标记该标
spring-data-mongo - 可选查询参数？

我正在使用 spring data mongo 和基于 JSON 的查询方法并且不确定如何在搜索查询中允许可选参数例如假设我有以下功能 Query name regex 0 options i createdDate gte 1 lt
Swift 4 - 在 mac os 上使用 AVAssetWriter 进行 avfoundation 屏幕和音频录制 - 视频冻结

我正在使用 Aperture 从屏幕录制音频和视频我们需要降低视频的比特率所以我尝试重写它并使用 AVAssetWriter 录制视频我的实现基于 CustomCamera 项目并且几乎可以工作问题出在视频中几秒钟后它就冻结了
Google 脚本 .setFormula 字符串值错误[重复]

这个问题在这里已经有答案了我是新手所以请原谅这个简单的问题我正在尝试将以下公式插入 google 工作表 L2 R1 最终产品的单元格 E18 中 if D17 Poor 0 if D17 Acceptable 1 if D17 Ex
如何将控制台和文档上的内置方法分配给javascript中的变量？

我正在尝试将 console log 方法的条件分配实现为变量如下所示 var dbglevel 1 var dbg dbglevel gt 0 console log function dbg message throws TypeEr
初始化（复杂）静态数据成员的 Pythonic 方法

我有一个包含复杂数据成员的类我想保持静态我想使用函数初始化一次 Pythonic 是这样的 def generate data do some analysis and return complex object e g list c
sudo Kill 导致权限被拒绝

ps 辅助 grep 节点结果 root 2814 0 0 0 0 4344 0 S Mai27 0 00 sh c node node modules webpack dev server bin webpack dev server j
宏定义

我尝试定义一个宏其功能如下调用 1 没有问题但调用 2 提示编译器错误因为第三个参数不可用如何定义一个同时支持调用1和调用2的宏 define RDF LOG dbglevel fmt rdfDBG dbglevel fmt VA
如何获取未缓存的数据？

当我尝试与数据交互时会抛出错误 const user client users cache get user id user send message 类型错误无法读取未定义的属性发送缓存实用程序说明缓存是一个收藏 https d
如何使用 sed 删除双换行符？

I tried sed i s n n file 但它不起作用我仍然想要单行中断 Input abc def ghi jkl 期望的输出 abc def ghi jkl 这可能对你有用 GNU sed sed a N s n ta fil
混合应用程序取决于服务器端补丁

我想制作一个混合应用程序可以像网站一样经常修补并立即反映原生应用每次都需要花费太多时间才能获得商店的批准因此搜索了 Cordova Xamarin React Native 等但不确定哪一个最适合我我不会使用复杂的函数或逻辑也不
使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？

按照我之前的问题尽管手册页有免责声明为什么 strchr 似乎可以使用多字节字符 https stackoverflow com q 25566356 3194340 我发现strchr是一个糟糕的选择相反我正在考虑使用strstr

使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？

使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？ 的相关文章

随机推荐

热门标签

使用“strstr”在字符串中搜索多字节 UTF-8 字符是否安全？的相关文章