匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么

2024-04-30

我想匹配all拉丁语块中的小写字母形式。简单的 '[a-z]' 仅匹配 U+0061 和 U+007A 之间的字符，而不匹配所有其他小写形式。

我想匹配所有小写字母，最重要的是，EFIGS 语言中使用的拉丁语块中的所有带重音的小写字母。

[a-zà-ý] 是一个开始，但仍然有大量其他小写字符（请参阅http://www.unicode.org/charts/PDF/U0000.pdf http://www.unicode.org/charts/PDF/U0000.pdf）。有推荐的方法吗？

仅供参考，我正在使用Python，但我怀疑这个问题是跨语言的。

Python 的内置“islower()”方法似乎做了正确的检查：

lower = ''
for c in xrange(0,2**16): 
  if unichr(c).islower(): 
    lower += unichr(c)

print lower

Python 目前不支持正则表达式中的 Unicode 属性。看这个答案 https://stackoverflow.com/questions/1832893/python-regex-matching-unicode-properties/1836283#1836283的链接波尼古鲁玛图书馆 http://dev.pocoo.org/hg/sandbox/ponyguruma这确实支持他们。

使用这样的库，您可以使用\p{Ll}匹配 Unicode 字符串中的任何小写字母。

Unicode 标准中的每个字符都属于一个类别。\p{Ll}是小写字母的类别，而\p{L}包含“字母”类别之一中的所有字符（大写字母；小写字母；标题大写字母；修饰语字母；以及其他字母）。有关详细信息，请参阅《角色属性》一章统一码标准 http://www.unicode.org/versions/latest/。或者看这一页 http://www.regular-expressions.info/unicode.html有关在正则表达式中使用 Unicode 的详细解释。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么的相关文章

如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
是否有一个包可以维护所有带有符号的货币列表？

是否有一个 python 包提供所有或相当完整货币的列表与符号如美元的有优秀的pycountry 贪财的 https github com limist py moneyed and ccy http code google com
python 中的 h2o 框架子集

如何在 python 中对 h2o 框架进行子集化如果 x 是一个 df 并且 Origin 是一个变量那么在 pandas 中我们通常可以通过以下方式进行子集化 x x Origin AAF 但使用 h2o 框架会出现以下错误 H2O
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
Python 2 的 `exceptions` 模块在 Python3 中丢失了，它的内容到哪里去了？

一位朋友提到对于 Python 2 假设您在命令行上的路径环境变量中有它 pydoc exceptions 非常有用知道它应该可以为他每周节省几分钟的网络查找时间我自己每周都会用谷歌搜索一次例外层次结构所以这对我来说也是一个有用的提
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
如何检查号码是否是巴基斯坦用户的手机号码而不是固定电话号码

我所做的是从开头删除 92 或 0092 并使用以下代码检查它是否是巴基斯坦人的有效手机号码 if preg match 3 0 4 0 9 number 1 Pakistani mobile number else not a pakis
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return
高效创建抗锯齿圆形蒙版

我正在尝试创建抗锯齿加权而不是布尔圆形掩模以制作用于卷积的圆形内核 radius 3 no of pixels to be 1 on either side of the center pixel shall be decimal a
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col
使用 paramiko 运行 Sudo 命令

我正在尝试执行sudo使用 python paramiko 在远程计算机上运行命令我尝试了这段代码 import paramiko ssh paramiko SSHClient ssh set missing host key polic

随机推荐

将 TPopupMenu 与窗体的右侧对齐？

TPopupMenu 如何与窗体的右侧对齐问题是在调用之前似乎没有办法获取弹出菜单的宽度Popup X Y Integer 我正在尝试获得与 Chrome 中的系统菜单类似的行为你也可以只设置Alignment http docwik
引导表上的滚动条

I have table渲染在一个panel这是在一个modal 由于表格相对较大我想将其行数限制为 5 行以便模式不会滚动我浏览了 SO 和谷歌到处都看到我需要设置overflow y auto or overflow y scr
linq按顺序插入元素的方法

我有一个按元素的 Name 属性排序的元素集合我需要在保持顺序的同时将新元素插入集合中我正在寻找一种简洁的 LINQ 方法来做到这一点我的代码如下 this Children 是集合 d 是我需要插入的新元素需要两次遍历集合才能找到
Datatables.net 与 ReactJS，在列中渲染 ReactJS 组件

我有以下带有数据表的组件 import React Component from react import Link from react router import PanelContainer Panel PanelBody Grid
隐式参数解析——设置优先级

我正在尝试创建一个类型类Default为给定类型提供默认值这是我到目前为止所想到的 trait Default A def value A object Default def withValue A a A new Default A
按应用于 Pandas 中同一列的条件进行计数

这是我的数据框 acc index veh count veh type 001 1 1 002 2 1 002 2 2 003 2 1 003 2 2 004 1 1 005 2 1 005 2 3 006 1 2 007 2 1 007
Tensorflow：使用 Adam 优化器

我正在张量流中试验一些简单的模型包括一个看起来与第一个非常相似的模型面向 ML 初学者的 MNIST 示例 http www tensorflow org tutorials mnist beginners index md 但维数稍大一
有没有办法根据分组值一次生成多个 x-y 散点图，并按第三个变量排序？

我有多级数据组级别是个人由id指定变量索引表示不同的时间点有没有办法为每个人制作单独的散点图 x 与 y 全部显示在同一输出中并根据第三个变量 z 排序如果是这样可以添加颜色来指示第三个变量 z 的程度吗数据如下谢谢 gt
如何在blob存储中创建文件夹

我有一个文件例如Parent zip解压后它将产生以下文件 child1 jpg child2 txt child3 pdf 跑步时Parent zip通过下面的函数文件被正确解压到 some container child1 jpg
错误：无法找到“async”修饰符所需的所有类型。您是否定位了错误的框架版本，或者缺少对程序集的引用？

我的电脑配置如下视窗8 视觉工作室2012 NET框架4 5 我的项目配置是 WP 7 1 银光4 0 NET框架4 0 CTP ASYNC 已安装使用 async 和await 关键字该项目是在Windows 7机器上使用VS201
根据函数 R 中的 dot dot 获取变量参数的名称（解析）

我正在创建一个基于一些虚拟变量的自动绘图仪我这样设置 plotter lt function 将绘制我喂它的所有假人但是我希望它能够向绘图添加标签即变量名称我确实知道 deparse substitute variablename
如何编写返回 Validation 的函数？

这是我之前的后续question https stackoverflow com questions 30527740 composing validating functions in scala 假设我有两个验证函数如果输入有效则返回
消息传递功能创建 Sql 查询和数据库视图

鉴于以下情况我需要能够获取给定用户参与的所有线程的列表首先按最新消息排序仅显示最新消息每个线程 1 条消息这是上面的 SQL 查询 SELECT Message MessageId Message CreateDate Messa
Jena tdb 中的事务发生错误？

我正在尝试将属性写入模型然后查询它我的代码的这一部分 String directory EMAILADDRESS create the dataset for the tdb store Dataset ds TDBFactory cr
从补丁文件中删除对特定文件的更改

我有一个更改了许多文件的补丁文件它意外地包含了对某些不应该更改的文件的更改我可以手动从补丁中删除所有提及这些文件的内容以生成正确的补丁文件但这是一个繁琐的过程如何以编程方式标准 nix 工具从补丁中删除所有提及文件的内容注意
对于缺少基线点的重复 ID，从基线进行更改

对于缺少基线点的重复 ID 从基线进行更改类似的问题已被提出并回答如下重复 id 相对于基线的变化 https stackoverflow com questions 31619437 change from baseline for
如何在会话自动加载的同时在 vim 中打开文件？

我在 vimrc 中有以下代码可以在 vim 启动时自动保存加载会话 Session saving Automatically save rewrite the session when leaving Vim augroup leav
如何在Java中读取文件的最后“n”个字节

如何在不使用 RandomAccessFile 的情况下从文件中读取最后 n 个字节我的文件中的最后 6 个字节包含写回文件时的重要信息我需要写入原始文件然后将最后 6 个字节附加到其他地方有什么指导吗谢谢你必须使用随机存取文件
如何防止`ssconvert`在转换之前重新计算Excel文件？

我正在尝试转换 xlsx 文件http www eia gov forecasts steo archives mar14 base xlsx http www eia gov forecasts steo archives mar14 b
匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么

我想匹配all拉丁语块中的小写字母形式简单的 a z 仅匹配 U 0061 和 U 007A 之间的字符而不匹配所有其他小写形式我想匹配所有小写字母最重要的是 EFIGS 语言中使用的拉丁语块中的所有带重音的小写字母 a z 是一个

匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么

匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么 的相关文章

随机推荐

热门标签

匹配所有 utf-8/unicode 小写字母形式的正确正则表达式是什么的相关文章