Python：如何按子串相关性对字符串列表进行排序？

2023-11-30

我有一些字符串列表，例如：

["foo bar SOME baz TEXT bob",
"SOME foo bar baz bob TEXT",
"SOME foo TEXT",
"foo bar SOME TEXT baz",     
"SOME TEXT"]

我希望它按精确度排序SOME TEXT子字符串（大写无关紧要）。像这样的命令：

["SOME TEXT",
"foo bar SOME TEXT baz",
"SOME foo TEXT",
"foo bar SOME baz TEXT bob",
"SOME foo bar baz bob TEXT"]

这个想法是 - 最好的分数得到与子字符串单词位置最匹配的字符串。对于子字符串单词之间“草率”单词的数量越大，它的排序就越低。

我发现了一些像fuzzyset, or 编辑距离但我不确定这就是我需要的。正如我所理解的，我知道我想要排序的确切子字符串，并且这些库搜索相似的单词。

实际上，我需要在 Django 项目中进行一些数据库查询（Postgresql）后进行这种排序。我已经尝试过使用 ORM 进行全文搜索，但没有得到相关的排序顺序（它不计算子字符串单词之间的距离）。接下来我尝试了 Haystack+Whoosh，但此时也没有找到如何进行这种排序的信息。所以现在的想法是获取查询集，然后将其从数据库中排序（是的，我知道这可能是一个糟糕的决定，但现在我希望它能正常工作）。但是，如果有人告诉我如何在我在这里提到的任何技术中做到这一点 - 那也将非常酷。谢谢你！

附注子字符串的长度应为 2-10 个单词，最多 20 个单词的字符串。

您可以使用difflib.序列匹配器，实现与您所需的输出非常相似的结果：

>>> import difflib
>>> l = ["foo bar SOME baz TEXT bob", "SOME foo bar baz bob TEXT", "SOME foo TEXT", "foo bar SOME TEXT baz", "SOME TEXT"]
>>> sorted(l, key=lambda z: difflib.SequenceMatcher(None, z, "SOME TEXT").ratio(), reverse=True)
['SOME TEXT', 'SOME foo TEXT', 'foo bar SOME TEXT baz', 'foo bar SOME baz TEXT bob', 'SOME foo bar baz bob TEXT']

如果您无法区分唯一的区别是两个元素的位置"foo bar SOME TEXT baz" and "SOME foo TEXT"与您想要的输出相比被交换。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Sorting

Python：如何按子串相关性对字符串列表进行排序？的相关文章

Python 2.7 将比特币私钥转换为 WIF 私钥

作为一名编码新手我刚刚完成了教程教程是这样的 https www youtube com watch v tX XokHf nI https www youtube com watch v tX XokHf nI 我想用 1 个易于阅读
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
按升序对 NSDictionary 进行排序

我正在尝试排序NSDictionary按升序排列我正在使用这段代码 NSDictionary valDict self mGetDataDict key rowKey for NSString valueKey in valDict al
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
了解 Python 中的酸洗

我最近接到一项作业需要以腌制形式放置一本字典其中每个键引用一个列表唯一的问题是我不知道腌制形式是什么谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法用于序列化和反序列化 Pyth
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
对对象集合进行排序[重复]

这个问题在这里已经有答案了如果我有一个简单的字符串列表 List
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

从 Rails 导出 CSV 数据

我正在努力从 Rails 导出 CSV 数据我正在按照这里的教程进行操作 http railscasts com episodes 362 exporting csv and excel view asciicast 在我的控制器中我有
Gradle构建错误将字节码转换为dex时出错：原因：com.android.dex.DexException：多个dex文件定义Landroid/arch/lifecycle/liveData$1

从过去 3 天开始我收到此错误并已尝试了所有可能的方法谁能帮我纠正一下我正在使用 Android 3 0 我的 sdk 和 Google Play 服务已更新并且我已添加multiDexEnabled true我的代码并且还尝试
如何在 swift 中使用模态视图？

When adding an account to Mail in preferences you get a modal view like this 我的问题是如何以编程方式复制这个换句话说如何在呈现视图上显示模态 UIView
Mybatis resulttypehashmap 的 null 值
查找两个单词是否是彼此的字谜

我正在寻找一种方法来查找两个字符串是否是彼此的字谜 Ex string1 abcde string2 abced Ans true Ex string1 abcde string2 abcfed Ans false 我想出的解决方案是对两个
如果付款失败，PayPal Standard 是否会自动重试向客户收费？

我必须将 PayPal 标准付款集成到我的 Saas 中才能按月订阅我在 PayPal 文档中找到了一些有关使用 API 的提示但这不是我的情况如果几个月后由于客户没有钱而付款失败它是否会在接下来的几天内自动重试向客户收费还是我应
如何理解读内存屏障和易失性

有些语言提供了volatile修饰符被描述为在读取支持变量的内存之前执行读内存屏障读内存屏障通常被描述为一种确保 CPU 在执行屏障之后请求的读取之前已执行屏障之前请求的读取的方法然而使用这个定义似乎仍然可以读取过时的值换句话说
Visual Studio 在 Windows 7 上将 WINVER/_WIN32_WINNT 设置为 Windows 8？

我正在使用 Visual Studio 2012 在 Windows 7 x64 上执行一些测试看起来 Microsoft 的工具链正在设置 WIN32 WINNT to 0x602 WIN32 WINNT WIN8 运行我们的测试程序结
AdMob 填充率 = 0

我正在使用 admob 来开发前几天刚刚推出的应用程序一开始没有任何下载但是通过我现在使用的广告活动我昨天收到了 140 个请求截至目前已经收到 44 个请求并且还在增加中但在旧的 admob 网站上它仍然显示它未激活因为
我需要查看上传的图片的正确路径是什么？

在我的网络应用程序中我的一个页面正在将照片上传到路径 usr local rac picture name goes here 照片上传正常但我需要在另一个页面中访问它当我尝试从 JSP 访问它时它不会显示我猜我的照片路径不正确
使用具有多个参数的地图

蟒蛇的map可以接受多个可迭代对象当可调用对象可以接受相同数量的输入参数时使用如果输入可迭代的长度相同则其行为类似于传递压缩参数的列表理解例如 gt gt gt iterables spam eggs gt gt gt map ma
Swift 3. NSFetchRequest 属性ToFetch

在 Swift 3 中当我们使用NSFetchRequest 我们必须指定NSFetchRequestResult 但如何获取属性值数组呢如果我使用这样的东西 let fetchRequest NSFetchRequest
在包含多段落单元格的 Word 表格中向下移动一行

如何可靠地向下移动 Word 表格中的行这是表的结构请注意第一列和第二列都可以有多行和段落 Rule ID 1 Logic Date must be equal to or greater than 01 Jan 2012 Discr
Rand 生成相同的数字

我制作的小游戏有问题 include stdafx h include
正则表达式单词边界末端和边缘之间的差异

R 帮助文件regex says 符号分别匹配空字符串单词的开头和结尾符号 b 匹配空字符串单词的边缘单词的末端和边缘有什么区别之间的区别 b and lt gt 就是它 b可以在 PCRE 正则表达式模式中使用当您指定pe
如果 libxml2 包不适用于我的版本，如何在 R 中安装它？

我想在 R 中安装 DESeq2 包但它缺少 xml2 config 文件我在某处发现可以通过安装 libxml2 包来获取它但是当我尝试时它给出错误它不适用于 R 版本 3 4 2 有人知道该怎么做吗您可以安装开发版本 devt
确定网络连接链路速度

如何以编程方式确定活动网络连接的网络连接链接速度就像任务管理器在网络选项卡中显示的那样我并不是真正追求可用带宽只是当前连接的数字例如54Mbps 100Mbps 等 Win32 NetworkAdapterWMI 类可以帮助您
magento 对自定义集合进行分页

我有一个自定义页面我在其中通过跨模型与品牌使用自定义查询来显示自定义产品我有一系列产品 ID 现在我似乎不知道如何实现 magento 的默认分页系统任何帮助将不胜感激提前致谢第1步控制器 IndexController php
你可以使用CSS来镜像/翻转文本吗？

是否可以使用 CSS CSS3 镜像文本具体来说我有这个剪刀字符 9986 我想显示向左而不是向右您可以使用 CSS 转换来实现此目的水平翻转涉及缩放 div 如下所示 moz transform scale 1 1 webkit
Python：如何按子串相关性对字符串列表进行排序？

我有一些字符串列表例如 foo bar SOME baz TEXT bob SOME foo bar baz bob TEXT SOME foo TEXT foo bar SOME TEXT baz SOME TEXT 我希望它按精确度排

Python：如何按子串相关性对字符串列表进行排序？

Python：如何按子串相关性对字符串列表进行排序？ 的相关文章

随机推荐

热门标签

Python：如何按子串相关性对字符串列表进行排序？的相关文章