Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
获取Python中匹配字符串的特定模式后出现的数字
我想获取所有匹配的数字 仅数字示例 0012 22 或包含与其对应的某些文本 示例 RF332 的数字 该数字与提供的字符串列表匹配 代码中的 my list 带有数字的文本的显示格式类似于用一两个空格分隔 提供示例输入文件以供参考 这是输
python
regex
stringmatching
R模糊字符串匹配根据匹配的字符串返回特定列
我有两个大型数据集 一个大约有 50 万条记录 另一个大约有 7 万条记录 这些数据集有地址 我想匹配较小数据集中的任何地址是否存在于大数据集中 正如您所想象的那样 地址可以用不同的方式和不同的情况 拼写等来书写 此外 如果只写到建筑物级别
r
MERGE
dataTable
stringmatching
stringdist
博耶摩尔算法的实现?
有 C 语言的 Boyer Moore 字符串搜索算法的工作示例吗 我浏览了一些网站 但它们似乎有很多问题 包括维基百科 Thanks 子字符串搜索算法的最佳网站 http igm univ mlv fr lecroq string htt
c
stringmatching
boyermoore
r中的模糊字符串匹配
我有 2 个数据集 每个数据集超过 100K 行 我想根据匹配一列 电影标题 的模糊字符串以及使用发布日期来合并它们 我提供了下面两个数据集中的样本 数据集 1 itemid userid rating time title release
r
stringmatching
fuzzysearch
正则表达式返回未定义的字符串
我试图从磁力链接中提取哈希值 但它返回不明确的 var tesst magnet xt urn btih 2B78EDFDDC87DC9605FB285997A80B787888C194 var test tesst match magne
javascript
regex
stringmatching
在 Emacs Lisp 中检查字符串是否以后缀结尾
是否有一个函数可以检查字符串是否以某个子字符串结尾 Python 有endswith http docs python org 2 library stdtypes html highlight endswith str endswith
string
emacs
elisp
Substring
stringmatching
加速“最接近”字符串匹配算法
我目前正在处理一个非常大的位置数据库 并尝试将它们与现实世界的坐标相匹配 为了实现这一点 我下载了地名数据集 https www geonames org export 其中包含很多条目 它给出了可能的名称和纬度 经度坐标 为了尝试加快该过
python
Algorithm
performance
languageagnostic
stringmatching
迭代包括空行在内的行
给定一个带有一些空行的多行字符串 我如何在Lua中迭代行包括空行 local s foo nbar n njim for line in magiclines s do print line and blank or line end gt
string
lua
stringmatching
luapatterns
在 dplyr 中过滤字符串列上的多个值
我有一个data frame其中一列中包含字符数据 我想过滤多个选项data frame来自同一列 有没有一种简单的方法可以做到我所缺少的 Example data frame name dat days name 88 Lynn 11 T
r
dplyr
stringmatching
multipleconditions
如何使用高级字符串匹配对数据进行子集化
我有以下数据框 我想根据匹配的字符串从中提取行 gt GEMA EO5 gene symbol fold EO p value RefSeq ID BH p value KNG1 3 433049 8 56e 28 NM 000893 NM
r
stringmatching
subset
C# 字符串比较方法返回第一个不匹配的索引
是否存在现有的字符串比较方法 该方法将根据两个字符串之间第一次出现的不匹配字符返回一个值 i e string A 1234567890 string B 1234567880 我想返回一个值 让我可以看到匹配中断的第一次出现是 A 8
c
stringmatching
C++ 匹配文件中的字符串并获取行号
我有一个包含前 1000 个婴儿名字的文件 我想询问用户一个名字 搜索文件 并告诉用户该名字对于男孩名字的排名以及女孩名字的排名 如果它不是男孩名字或女孩名字 它会告诉用户它不属于该性别的流行名字 该文件的布局如下 Rank Boy Nam
c
iostream
stringmatching
如何使用similar_text()改进PHP字符串匹配?
我正在使用 PHP 的imilar text 调用来比较两个字符串 但是 我没有得到足够好的结果 例如 对于我希望看到 100 的匹配 我得到的最好结果是 80 95 我还可以使用哪些其他函数来深入了解字符串的核心
php
Text
stringmatching
正则表达式匹配以测试有效年份
给定一个值 我想验证它以检查它是否是有效的年份 我的标准很简单 其中值应该是整数4人物 我知道这不是最好的解决方案 因为几年前它不允许1000并将允许诸如5000 这个标准足以满足我当前的情况 我想出的是 d 4 虽然这有效 但它也允许负值
regex
string
validation
stringmatching
计算字符串中连续字母的最大数量
我有这个向量 vector lt c XXXX X X X X X X XX X X X X XX X X X X XX X X X X XX XX X X XXX X XX X 我想检测出现 X 的最大连续次数 因此 我的预期向量将是 4
r
regex
string
stringmatching
stringr
单个列表中的近似字符串匹配 - r
我在一个长列表中包含数千个名字的数据框中列出了一个列表 许多名称都有细微的差别 这使得它们略有不同 我想找到一种方法来匹配这些名字 例如 names lt c jon smith jon smith Jon Smith jon smith
r
stringmatching
agrep
了解 Knuth Morris Pratt (KMP) 失效函数
我一直在读关于 Knuth Morris Pratt 算法的维基百科文章 http en wikipedia org wiki Knuth E2 80 93Morris E2 80 93Pratt algorithm我对如何在跳转 部分匹配
string
Algorithm
stringmatching
knuthmorrispratt
R:Regex_Join/Fuzzy_Join - 以不同的词序连接不精确的字符串
df1 df2 df3 library dplyr library fuzzyjoin df1 lt tibble a c Apple Pear Orange Sock Shoe Hat Cat Mouse Dog df2 lt tibbl
r
regex
stringmatching
fuzzyjoin
agrep:只返回最佳匹配
我在 R 中使用 agrep 函数 它返回匹配向量 我想要一个类似于 agrep 的函数 它只返回最佳匹配 或者如果存在平局则返回最佳匹配 目前 我正在对结果向量的每个元素使用 cba 包中的 sdist 函数来执行此操作 但这似乎非常多余
r
Text
character
stringmatching
agrep
删除 pandas DataFrame 列中字符串条目的末尾
我有一个 pandas Dataframe 其中一列是文件列表 import pandas as pd df pd read csv fname csv df head filename A B C fn1 txt 2 4 5 fn2 tx
python
pandas
DataFrame
stringmatching
1
2
3
»