python - 检查字符串的一部分是否在列表中的有效方法

2024-04-23

我有一个巨大的字符串，例如：

睡鼠的故事。从前，有三个小姐妹;他们的名字是埃尔西、莱西和蒂莉；他们住着在井底......坏话......

我有一份大约 400 个脏话的清单：

bad_words = ["badword", "badword1", ....]

检查文本是否包含坏词列表中的坏词的最有效方法是什么？

我可以循环文本和列表，如下所示：

for word in huge_string:
   for bw in bad_words_list: 
    if bw in word: 
       # print "bad word is inside text"...

但这对我来说似乎是90年代的..

Update:坏词是单个词。

将文本转换为一组单词并计算其与一组不良单词的交集将为您提供摊销速度：

text  = "The Dormouse's story. Once upon a time there were three little sisters; and their names were Elsie, Lacie and Tillie; and they lived at the bottom of a well....badword..."

badwords = set(["badword", "badword1", ....])

textwords = set(word for word in text.split())
for badword in badwords.intersection(textwords):
    print("The bad word '{}' was found in the text".format(badword))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python - 检查字符串的一部分是否在列表中的有效方法的相关文章

Lighttpd 和 cgi python

我正在尝试通过 lighttpd 执行一些 python 脚本但是当我尝试运行它时我只得到一个要求我下载的空白文件 lighttpd conf server modules mod access mod alias mod access
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
使用 python requests 模块时出现 HTTP 503 错误

我正在尝试发出 HTTP 请求但当前可以从 Firefox 浏览器访问的网站响应 503 错误代码本身非常简单在网上搜索一番后我添加了user Agent请求参数但也没有帮助有人能解释一下如何消除这个 503 错误吗顺便说一句
为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
使用字典映射数据帧索引

为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

如何从内核空间读取/写入 linux /proc 文件？

我正在编写一个由用户程序和内核模块组成的程序内核模块需要收集数据然后将其发送到用户程序这必须通过 proc 文件来完成现在我创建了文件一切都很好并且花了很长时间在互联网上寻找答案但仍然找不到如何读写 proc 文件f
如何使用 jQuery 在 ASP.NET MVC 中重新加载带有部分视图的 div？

我有一个 div 其部分位于页面的某处我在按钮上有一个事件我如何编写一个 Javascript 来获取 div 并重新加载它并重新加载部分视图我从另一个角度看这个问题但我现在不能这样做但我需要同样的事情发生只由 jQuery
如何从查询窗口向 SQL Server 插入 unicode 文本

我正在使用以下代码 INSERT INTO tForeignLanguage Name VALUES 这个值像这样插入如何从 sql Management Studio 查询窗口插入 unicode 文本以下应该有效 N表示 MSSQL
无效的 Apple Watch 图标文件名必须与模式“*@x.png”匹配

我正在尝试向我的应用程序提交更新以包含 Apple Watch 功能但是每当我验证构建时我都会收到下面屏幕截图中详细说明的错误查看底部错误我的文件名似乎与模式匹配所以我不明白问题是什么如果我能为 1 个图标找到正确的模式那么我
找出哪些本地分支与远程不同步

假设我有一个包含多个分支的 git 存储库我怀疑有些分支没有被推到上游或者已经过时或者两者兼而有之即分歧有没有一种方法可以通过一个命令找出哪些分支与远程不同步写一个脚本是可以的但我想知道是否已经有这样的脚本我已经做了一个脚本
如何安全地向特定用户发送消息

我正在使用 ASP NET MVC 5 和 SignalR 我想向特定用户发送消息我遵循了中解释的方法本教程 https learn microsoft com en us aspnet signalr overview guide to
Xcode - 从不同视图更新 ViewController 标签文本

我的项目中有两个视图控制器ViewController SettingsView 在这里我尝试更新ViewController s标签当我点击SettingsView s返回键 NSLog工作正常但标签没有更新请帮我设置视图 m I
PHP：会话不工作

当用户在客户端登录时我将重定向到服务器一旦验证了他的 user id 和密码我将在 user id 上设置会话我将重定向回客户端然后我要求填写个人资料信息如果他想通过 facebook 填写信息则会出现弹出窗口请求 fac
匹配 mod_rewrite 规则正则表达式中的问号

我正在寻找使用多个子字符串重写网址一个子字符串作为子目录被请求而任何其他子字符串作为普通查询字符串参数被请求例如我想重写 url http www mysite com mark friends page 2 to http www
字符串计算器[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案各位程序员大家好我正在创建一个计算器C 我有一个字符串变量math其中包含100 5 2 我怎样才能显示它的输出498在我的控制台中
使用 bcp 获取可构建的 Boost 提取

我正在使用 bcp 从 Boost 中提取 Boost Archive 不幸的是我无法构建这个摘录 Boost Archive 不是一个仅包含头文件的库贾姆抱怨 Unable to load Boost Build could not f
如何在 Eclipse IDE 中默认将 Scala 项目作为 Scala 应用程序运行？

我是 Eclipse IDE 的新手问题是如何默认将 Scala 项目作为 Scala 应用程序运行当我通过按 R 键运行项目时它总是询问如何将其作为 Scala 或 Java 应用程序运行有没有办法跳过这个并始终默认以 Scala
使用 nextFloat() 线程“main”中出现 java.util.InputMismatchException 异常

所以我正在编写一个小程序来计算学生最好成绩的平均值当我运行它时我在线程 main java util InputMismatchException中收到此错误异常我看到一篇文章说要使用 nextLine 然后使用 parseInt 在
查找列中字段的平均值[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个这样的记录 1 11 11 T A 0 0 A 1 B 2 C 3 D 4 有 8 列每列由制表符空格分隔我需要的输出是这
Ruby on Rails：是否有一种方法可以从数据库检索数据数组，而无需 Rails 实例化任何内容？

我有一个模型试图从中检索数据数组并且不需要将数据实例化为 Ruby 对象事实上这只是在我的代码中引入了一个额外的步骤来逐步遍历对象并生成一个仅包含我需要的数据的新数组 Example class Book has attribute
如何手动销毁成员变量？

我有一个关于析构函数的基本问题假设我有以下课程 class A public int z int ptr A z 5 ptr new int 3 A delete ptr 现在析构函数应该销毁对象的实例上面的析构函数正是这样做的释放由
使用 MySQL 将一个值与表中的多个列（在一个语句中）进行匹配

我正在使用 MySQL 中的一个表其中包含以下列 id january february march april etc 表中的数据如下所示 aa 0 0 1 0 ab 1 0 1 0 ac 1 1 0 0 ad 1 1 1 0 要查询它
如何使用 Firebug 或类似工具调试 JavaScript / jQuery 事件绑定？

我需要调试一个使用 jQuery 执行一些相当复杂和混乱的 Web 应用程序DOM http en wikipedia org wiki Document Object Model操纵在某一时刻一些绑定到特定元素的事件不会被触发而是停
为什么使用cloneNode()时

python - 检查字符串的一部分是否在列表中的有效方法

python - 检查字符串的一部分是否在列表中的有效方法 的相关文章

随机推荐

python - 检查字符串的一部分是否在列表中的有效方法的相关文章