从 python 的单词列表中查找最长的常见单词序列

2024-05-08

我搜索了很多解决方案，确实发现了类似的问题。这个答案 https://stackoverflow.com/questions/21930757/longest-repeated-substring返回可能不属于输入列表中所有字符串的最长字符序列。这个答案 https://stackoverflow.com/questions/47099802/longest-common-sequence-of-words-from-more-than-two-strings返回必须属于输入列表中所有字符串的最长公共单词序列。

我正在寻找一个上述解决方案的组合。也就是说，我想要最长的常见单词序列，这些单词可能不会出现在输入列表的所有单词/短语中。

以下是一些预期的示例：

['exterior lighting', 'interior lighting'] --> 'lighting'

['ambient lighting', 'ambient light'] --> 'ambient'

['led turn signal lamp', 'turn signal lamp', 'signal and ambient lamp', 'turn signal light'] --> 'turn signal lamp'

['ambient lighting', 'infrared light'] --> ''

谢谢

此代码还将按列表中最常见的单词对所需列表进行排序。它会计算列表中每个单词的数量，然后删除只出现一次的单词并对其进行排序。

lst=['led turn signal lamp', 'turn signal lamp', 'signal and ambient lamp', 'turn signal light'] 
d = {}
d_words={}
for i in lst:
    for j in i.split():
      if j in d:
          d[j] = d[j]+1
      else:
          d[j]= 1
for k,v in d.items():
    if v!=1:
        d_words[k] = v
sorted_words = sorted(d_words,key= d_words.get,reverse = True)
print(sorted_words)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

longestsubstring

从 python 的单词列表中查找最长的常见单词序列的相关文章

Python setuptools：如何在 setup.py 中添加私有存储库 (gitlab)？

我上传了 2 个包它们位于我的 gitlab 存储库中如果我想使用 pip 将它们安装在我的系统中这很容易因为 gitlab 可以帮助您 https docs gitlab com ee user packages pypi rep
xlrd.biffh.XLRDError：Excel xlsx 文件；不支持[重复]

这个问题在这里已经有答案了我正在尝试使用读取启用宏的 Excel 工作表pandas read excel与 xlrd 库它在本地运行良好但是当我尝试将其推送到 PCF 时我收到此错误 2020 12 11T21 09 53 441
切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
PyQt：如何通过匿名代理使用网页

这真让我抓狂我想在 QWebPage 中显示一个 url 但我想通过匿名代理来实现 Code setting up the proxy proxy QNetworkProxy proxy setHostName 189 75 98 199
即使页面未完全加载，我们也可以使用 Selenium 获取页面源吗（TimeoutException: Message: timeout）？

即使遇到 TimeoutException Message timeout 也能获取页面源码吗当我调用 driver page source 时有时无法加载整页但我只需要它的部分信息尚未确定所以我只想在任何情况下保存页面是否可以
Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
希伯来语中的稀疏句子标记化错误

尝试对希伯来语使用稀疏句子标记 import spacy nlp spacy load he doc nlp text sents list doc sents I get Warning no model found for he Onl
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

我可以在 iOS 中测量蓝牙信号强度吗？

Can I 测量信号强度我的 iPhone 范围内的蓝牙设备数量基本上我想要做的是扫描范围内的设备列表然后查看哪个设备的信号强度最高在 iOS 中是否可行如果可以我该怎么做是的有一种方法可以测量蓝牙低功耗 4 0 的信号强度
锚标记内的 CakePHP Span 标记

我试图让 CakePHP 输出一个如下所示的链接 a href foo bar class some other classes span class icon new span FooBar a 所以我在我看来使用以下代码
使用 string.whitespace 删除 Python 中的空格

Python 的 string whitespace 很棒 gt gt gt string whitespace t n x0b x0c r 如何在不手动输入 t n 等正则表达式的情况下将其与字符串一起使用例如它应该能够转动请不要伤
jQuery：评估 ajax 响应中的脚本

来自我的 web 应用程序的 XML 响应既有要添加到页面的 HTML 也有要运行的脚本我正在尝试从我的网络应用程序发回 XML 例如
散景服务器获取鼠标位置

我正在开发一个带有散景 0 12 2 的交互式应用程序它根据特定的交互更新绘图现在我使用滑块来更改图中字形的位置但实际上我想访问鼠标在特定图中的位置数据集是一个多维矩阵张量密集数据每个图在特定位置显示一个维度如果我更改一个
与 Ruby 1.9.X 中的 Iconv.conv("UTF-8//IGNORE",...) 等效吗？

我正在从远程源读取数据偶尔会得到另一种编码的一些字符它们并不重要我想得到一个最佳猜测 utf 8 字符串并忽略无效数据主要目标是获得一个我可以使用的字符串并且不会遇到以下错误编码 UndefinedConversionErr
使用 Doctrine2 时的多重歧视级别

我正在使用 Doctrine2 来管理我的模型如下有一个抽象概念Content与复合模式Gallery 也是一个抽象概念Media从中Video and Image继承我的选择是添加鉴别器Content and Media表以便区分G
改变 RGB 颜色的色调

我正在尝试编写一个函数来改变 RGB 颜色的色调具体来说我在 iOS 应用程序中使用它但数学是通用的下图显示了 R G 和 B 值如何随色调变化看起来编写一个函数来改变色调似乎应该是一个相对简单的事情而不需要对不同的颜色格式进
如何从 Java 类调用 Kotlin 类

我需要将意图从 java 活动传递到 Kotlin 活动 Java活动ProfileActivity class Intent selectGameIntent new Intent ProfileActivity this kotlin
EF 6 基于代码的迁移：向现有实体添加非空属性

我想向现有表添加一个非空外键列环境 EF 6 代码优先基于代码的迁移 Code from Migration class for new entity Currency CreateTable dbo Currency c gt new
了解子表单何时关闭

我有一个带有按钮的 Form1 当您单击按钮时将执行以下代码块 Form2 frm new Form2 frm Name Form musteriNumarasi ToString frm Text Kullan c musteriNum
有没有办法自动折叠解决方案资源管理器中的脚本文档部分？

在调试模式下解决方案资源管理器有一个脚本文档部分默认情况下它是展开的当调试器运行时新的ScriptDocumentxxx poll txt文件被添加到此部分当我浏览资源管理器文件时添加这些新行项目会导致资源管理器的整个内容向下移
如何获取每个类别（例如 WooCommerce 后端）的产品数量？

我正在建立一个新网站我对 Woocommerce 非常满意我只需要一个快速技巧来获取每个类别中的产品数量我已经调出了每个产品的类别但无法弄清楚如何从该类别中获取产品数量我有一个适合我的产品的列表样式实际上是活动网站的活动查看图
如何找到类路径上具有特定方法注释的所有类？

我想在Java中实现一个基于注释的初始化机制具体来说我定义了一个注释 Retention RetentionPolicy RUNTIME Target ElementType METHOD public interface Initia
VHDL STD_LOGIC_VECTOR 通配符值

我一直在尝试用 VHDL 代码为我在 Altera DE1 板上实现的简单 16 位处理器编写有限状态机在有限状态机中我有一个CASE处理不同 16 位指令的语句这些指令由 16 位 STD LOGIC VECTOR 带入 FSM 但
客户端凭据授予的访问令牌是否可以映射到用户？

我想使用 oauth2 中的客户端凭据授予来保护 API 但是我希望访问令牌映射到单个用户由我在带外信任设置阶段选择在该阶段我共享密钥秘密这是一个问题吗我知道使用客户端凭据授予的访问令牌不应该在用户的上下文中以这种方式绑定它
自定义键盘 iphone，UITextView 中的退格按钮有问题

检查此代码我的自定义键盘 IBAction updateTextBackSpace id sender if txtview text length gt 0 NSString deletedLastCharString txtview
如何告诉杰克逊在反序列化期间忽略空对象？

在反序列化过程中据我理解是将JSON数据转换为Java对象的过程我如何告诉Jackson 当它读取不包含数据的对象时应该忽略它我正在使用 Jackson 2 6 6 和 Spring 4 2 6 我的控制器收到的JSON数据如下 i
Linq：Select 和Where 之间有什么区别

The Select and WhereLinq 中提供了方法对于这两种方法每个开发人员都应该了解什么例如何时使用其中一种而不是另一种使用一种相对于另一种的优势等 Where 查找匹配的项目并仅返回匹配的项目过滤 gt IEnu
从 python 的单词列表中查找最长的常见单词序列

我搜索了很多解决方案确实发现了类似的问题这个答案 https stackoverflow com questions 21930757 longest repeated substring返回可能不属于输入列表中所有字符串的最长字符序列

从 python 的单词列表中查找最长的常见单词序列

从 python 的单词列表中查找最长的常见单词序列 的相关文章

随机推荐

热门标签

从 python 的单词列表中查找最长的常见单词序列的相关文章