PHP:删除unicode文本中少于3个字符的单词

2024-02-29

我使用这些正则表达式来删除少于 3 个字符的单词:

$str = preg_replace("!\\b\\w{1,3}\\b!", "", $str);  

and

$rdu = "/\b[^\b]{1,2}\b/";
$str = preg_replace($rdu , " ", " " . $str . " "); 

但在 unicode 文本中返回我:

� �� �� �������� ��� �� � �� �� �������� ��� �� 
....

有没有办法使用或不使用正则表达式来删除 unicode 文本中少于 3 个字符的单词?

THXA


Use the u用于 UTF-8 支持的修饰符 http://php.net/reference.pcre.pattern.modifiers:

/\b\w{1,2}\b/u
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PHP:删除unicode文本中少于3个字符的单词 的相关文章

  • Python正则表达式检查字符串是否包含任何单词

    我想搜索一个字符串并查看它是否包含以下任何单词 AB AG AS Ltd KB University 我在 javascript 中工作 var str Hello test AB var forbiddenwords new RegExp
  • 匹配没有周围字符列表的单词列表

    我有这个正则表达式 one common word or another 除非这两个单词相邻 否则它匹配得很好 One one s more word word common word or another word more anothe
  • 用javascript检查瑞典语字符?

    如何重写此代码以检查所有字符 包括瑞典语 和 字符 alphaExp a zA Z 以上仅检查英文字母 瑞典语在 Z 之后包含 其余部分与英语相同 Thanks 你试过了吗 a zA Z 在我的火狐浏览器中 a zA Z test 评估为真
  • Mongo 正则表达式用于“不匹配”或反向[重复]

    这个问题在这里已经有答案了 我的 mongo 文档都包含一个名为templateName 有一些包含该值的文档 a SystemDefaultTemplate b SystemDefaultTemplate c SystemDefaultT
  • 将时间值转换为数字,同时保留时间特征

    我有一个数据集 其中包含不同事件发生的间隔时间 我想要做的是将数据转换为数字向量 以便更容易操作和运行摘要 制作图表等 同时保持其时间特征 这是我的数据片段 data lt c 03 31 12 17 16 29 09 52 04 01 0
  • 正则表达式匹配 JWT

    我没有正则表达式的经验 我请求你的帮助 我需要一个正则表达式来捕获以下字符串中的 JWT contextJwt eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9 eyJzdWIiOiJIZWxsbyB5b3UiLCJ
  • R strsplit:根据字符分割,除非后面有特定字符

    假设我有一个字符串向量 例如 split these c File Location C Documents File Location Pete s Computer File Location 我想根据 分割该向量中的每个元素 除非后面
  • 正则表达式 - 从字符串末尾搜索

    我如何从字符串末尾定位某些内容 complexthing 50 other 50 MORE 50 我想以 50 结尾 但是这个 复杂的东西 可以以 结尾 所以在这种情况下 我不能在 处打断 因为乞求可能会让它感到困惑 所以对我来说最简单的正
  • RegEx 使用 match() 在 JavaScript 中提取字符串数组

    我正在尝试使用string match 在 javascript 中使用正则表达式来提取字符串数组 这是一个示例字符串 CREATE TABLE listings listing id INTEGER UNIQUE state TEXT t
  • mod_rewrite 可以转换任意数量、任意名称的参数吗?

    我对 mod rewrite 完全是个新手 我想做的事情听起来很简单 我不想拥有domain com script php a 1 b 2 c 3 我想要 domain com script a 1 b 2 c 3 问题是我的脚本采用各种组
  • 如何匹配撇号('),除非它被转义(\')?

    是否可以为此构造一个正则表达式 如果是这样 如果有人展示如何操作 我将不胜感激 使用这个正则表达式
  • 使用 sed 和 grep/egrep 进行搜索和替换

    我在用egrep R后跟包含大约 10 个并集的正则表达式 如下所示 jpg png gif等等 这很好用 现在我想替换所有找到的字符串 bmp 我在想类似的事情 egrep lR jpg png gif sed s some expres
  • 匹配可能存在或可能不存在的组

    我的正则表达式需要解析一个如下所示的地址 BLOOKKOKATU 20 A 773 00810 HELSINKI SUOMI 1 2 3 4 第一组 第二组和第三组将始终存在于地址中 第 4 组可能不存在 我编写了一个正则表达式来帮助我获得
  • 回退到正则表达式中字符串的开头

    是否可以让正则表达式退回到字符串的开头并再次开始匹配 这就是我问的原因 给定下面的字符串 我想捕获子字符串black red blue and green按照该顺序 无论主题字符串中出现的顺序如何 并且仅当所有子字符串都存在于主题字符串中时
  • 如何用该单词的单一版本替换重复单词

    我正在尝试使用 C 处理似乎使用语音转文本的文字记录 我遇到的一个主要问题是重复单词和 或短语 我很想使用正则表达式来替换它们 这里有些例子 我我我真的很想去 但是我不去 去不了 我真的很想使用正则表达式替换 所以它会变成这样 我真的很想去
  • 正则表达式查找两个字符之间的内部匹配

    环境 Java 我想匹配两个字符串之间的字符 这是一个例子 foo
  • API 调用时出现 UnicodeEncodeError (json)

    我正在尝试打印此 API 调用的结果 但收到 UnicodeEncodeError 可能是超级菜鸟问题 但非常感谢任何帮助 import http client import json api key hidden connection h
  • QT C++ QRegularExpression 多个匹配

    我想使用正则表达式从 QString html 中提取信息 我明确想使用正则表达式 无解析器解决方案 和类Q正则表达式 http qt project org doc qt 5 0 qtcore qregularexpression htm
  • Base 64 编码的有效字符范围

    我对以下内容感兴趣 是否有一个字符列表never作为 Base 64 编码字符串的一部分出现 例如 我不确定这种情况是否会发生 如果原始输入实际上有 作为它的一部分 编码会有所不同吗 这是我可以发现的 RFC 4648 http www r
  • 在字符串中每个字母后面添加数字

    我有几个具有固定格式的字符串 格式为一个字母后跟一个数字 例如 A3B1C7D1 但是 如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是

随机推荐

  • 如何反映可编码/可编码密钥协议的设计?

    我正在尝试实现类似于 Swift 如何利用CodableKeys在实现的类中定义的枚举上设置的协议Codable 就我而言 班级是CommandHandler枚举是CommandIds并且它不需要编译器的代码生成 因为枚举将始终被显式指定
  • 如何使用 HTML 敏捷包

    我该如何使用HTML 敏捷包 http html agility pack net z codeplex 我的 XHTML 文档不完全有效 这就是我想使用它的原因 我如何在我的项目中使用它 我的项目是用 C 编写的 首先 安装HTML敏捷包
  • 如何将多个 HTML 文件解析为单个 PDF?

    我想使用 iText 将一系列 html 文件转换为 PDF 例如 如果有这些文件 第1页 html page2 html page3 html 现在我想创建一个 PDF 文件 其中 page1 html 是第一页 page2 html 是
  • CSS - 悬停穿过元素以激活被覆盖元素上的悬停

    我的页面布局涉及大量绝对位置和 z 索引 因此有很多元素彼此重叠 其中一个元素仅包含文本 它悬停在许多其他内容之上 在该元素下方有几个应用了 CSS 悬停伪类的元素 当鼠标经过包含文本的元素时 我希望下面的元素以某种方式响应鼠标的存在并激活
  • Symfony2 Doctrine 实体未水合

    我得到一个实体Member从实体管理器中 做了一个 var dump 除了与的 ManyToOne 关系之外 一切正常Family 所以我尝试了var dump member gt getFamily 令人惊讶的是 唯一正确的值是家庭的 I
  • Pandas:FutureWarning:将列表喜欢传递给 .loc 或 [] [重复]

    这个问题在这里已经有答案了 当我运行脚本时 Pandas 给出以下内容 未来警告 FutureWarning Passing list likes to loc or with any missing label will raise Ke
  • 如何在没有小部件工厂的情况下为 Yii2 中的 GridView 设置默认配置?

    这是 Yii2 中 gridview 的样子 我想稍微改变我的网格 所以我添加了这一行 tableOptions gt class gt table table condensed 这很好用 但是 我希望这是我所有
  • 如何抓取foursquare签到数据?

    是否可以通过贪心的方式从foursquare中爬取签到数据 即使我与所有用户没有友谊 就像抓取公开的 Twitter 消息一样 如果您有什么经验或建议 请分享 谢谢 如果您有包含 foursquare 链接的公开推文 您可以通过发出 HEA
  • 测试嵌套结构中的 nil 值

    我在 go 中有一个深度嵌套的结构 它们是由 json 解组器构造的 然而 这个结构中的相当多的字段是 omitifempty 所以我用一个在不同地方可以有空的结构来结束操作 示例 真实的嵌套更深 而且很大 400 行结构 package
  • 视图主体中的 swiftui 三元运算符

    在 swiftyui 主体内部 基于 news urlToImage 值 我需要能够加载另一个视图 LOadRemoteImageView 这只是另一个接受可选 url 字符串来加载远程图像的视图 或者显示文本字符串 没有图像网址 按照下面
  • 原始类型是否被视为 JSON?

    大多数情况下 JSON 的格式如下 color red value f00 Or color red value f00 color red value f00 我想问 string bool int 等原始类型也是 JSON 吗 我找到了
  • Swagger-Net 显示控制器名称而不是端点方法

    我一直试图找出为什么 Swagger Net 不显示控制器中的端点方法 C 项目使用基于 Net Framework 4 6 1 的 Web API 模板 当我使用 SwashBuckler 时 我得到了相同的结果 所以这不是 Swagge
  • 当 HashMap 或 HashSet 达到最大容量时会发生什么?

    就在几分钟前 我回答了一个关于 Java中HashMap的最大可能大小 正如我一直读到的那样 HashMap 是一种可增长的数据结构 它的大小仅受 JVM 内存大小的限制 因此我认为它的大小没有硬性限制并做出了相应的回答 这同样适用于 Ha
  • 检查无向图中的奇数循环

    我带着另一个类似的问题回来了 我目前正在开发一个 Java 程序 该程序将检查图是否可 2 色 即它是否不包含奇数循环 奇数长度的循环 整个算法应该在 O V E 时间内运行 V 是图中的所有顶点 E 是图中的所有边 我当前的算法执行深度优
  • 根据 mongodb 中的正则表达式值从文档中查找匹配的项目

    我必须选择匹配的casts item m credits cast 使用正则表达式值从电影集合中获取 电影模态 var mongoose require mongoose var movieSchema new mongoose Schem
  • 如何通过电子邮件发送 HTML5 画布图像

    首先 我尝试使用 Pear 的 Mail mime 来完成此操作 但我无法从共享主机提供商和 cpanel 加载该类 接下来我按照指示这个帖子 https stackoverflow com questions 6150880 email
  • 调用 WebRequest GetSystemWebProxy()

    在 PowerShell 2 0 下 我知道您可以通过执行以下操作来设置您想要使用的代理 而无需知道确切的代理设置 proxy System Net WebRequest GetSystemWebproxy proxy Credential
  • 解析 JSON 以配置 Android 应用程序

    在我的 Android 应用程序中 我必须使用服务器中的 JSON 在应用程序中进行特定调整 我试图实现的目标是读取此 json 并将所有值存储到局部变量中以在应用程序内执行操作 来自服务器的 JSON sett glHdr sm scle
  • 如何获取 .wav 文件格式的 numpy 数组输出

    我是 Python 新手 我正在尝试训练我的音频语音识别模型 我想读取 wav 文件并将该 wav 文件的输出放入 Numpy 数组中 我怎样才能做到这一点 根据 Marco 的评论 您可以查看 Scipy 库 特别是scipy io fr
  • PHP:删除unicode文本中少于3个字符的单词

    我使用这些正则表达式来删除少于 3 个字符的单词 str preg replace b w 1 3 b str and rdu b b 1 2 b str preg replace rdu str 但在 unicode 文本中返回我 有没有