Python 在文本文件中搜索确切的单词/短语

2023-12-27

目前，我正在尝试在文本文件中搜索确切的单词/短语。我正在使用Python 3.4

这是我到目前为止的代码。

import re

def main():
    fileName = input("Please input the file name").lower()
    term = input("Please enter the search term").lower()

    fileName = fileName + ".txt"

    regex_search(fileName, term)

def regex_search(file,term):
    source = open(file, 'r')
    destination = open("new.txt", 'w')
    lines = []
    for line in source:
        if re.search(term, line):
            lines.append(line)

    for line in lines:
        destination.write(line)
    source.close()
    destination.close()
'''
def search(file, term): #This function doesn't work
    source = open(file, 'r')
    destination = open("new.txt", 'w')
    lines = [line for line in source if term in line.split()]

    for line in lines:
        destination.write(line)
    source.close()
    destination.close()'''
main()

在我的函数 regex_search 中，我使用正则表达式来搜索特定字符串。但是，我不知道如何搜索特定短语。

在第二个函数“搜索”中，我将该行拆分为一个列表，并在其中搜索单词。但是，这将无法搜索特定短语，因为我正在 ['the','dog','walked'] 中搜索 ["dog Walking"]，这不会返回正确的行。

edit:考虑到您不想匹配部分单词（“foo”不应匹配“foobar”），因此需要在数据流中向前查看。该代码有点尴尬，所以我认为正则表达式（您当前的 regex_search 已修复）是正确的方法：

def regex_search(filename, term):
    searcher = re.compile(term + r'([^\w-]|$)').search
    with open(file, 'r') as source, open("new.txt", 'w') as destination:
        for line in source:
            if searcher(line):
                destination.write(line)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Python 在文本文件中搜索确切的单词/短语的相关文章

在Python中使用字典作为switch语句[重复]

这个问题在这里已经有答案了我正在尝试使用字典用 Python 制作一个简单的计算器这是我的代码 def default print Incorrect input def add a b print a b def sub a b pr
tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
sklearn DeprecationWarning 数组的真值

从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
如何有效地从连续字符串中提取文字单词？ [复制]

这个问题在这里已经有答案了可能的重复如何将没有空格的文本拆分为单词列表 https stackoverflow com questions 8870261 how to split text without spaces into li
优化完美平方问题，类似于Python中的硬币找零

我这里有一个硬币兑换的解决方案 python 中的 leetcode 硬币兑换 https stackoverflow com questions 69517078 coin change leetcode in python 因为完全平方
如何修复 Apache mod_wsgi 的 Python 版本不匹配问题？

我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时在
使用 Pymongo 从 Windows 连接到 AWS 实例上的 MongoDB

此行反复抛出错误 client MongoClient ec2 12 345 67 89 us east 2 compute amazonaws com 27017 ssl True ssl keyfile C mongo pem 由于显而
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many

随机推荐

如何知道Linux中特定引脚的中断/GPIO编号

我正在做一个项目需要在 Linux 中处理中断我正在使用的板是基于三星的s3c6410 MCU arm 11处理器它具有以下I O接口如图所示我有用于外部中断的 EINTx 引脚和用作 GPIO 引脚的 GPxx 引脚我不介意使
从内部存储读取 JSON 文件的内容

如何从内部存储输出 JSON 文件的内容以下是目前正在开展的工作 String filename names json final File file new File Environment getDataDirectory filen
Go 中的多个response.WriteHeader 调用

我的 Go 服务器正在处理我首先调用的请求response WriteHeader 为了设置我的响应的状态代码之后我开始将字节写入响应正文如果浏览器在我复制字节时取消请求则会收到错误消息 write tcp 1 52319 brok
如果定义了父 pom，则不会发生存储库 url 的 Maven 属性替换

我遇到一个问题当且仅当定义了父 pom 时 maven 才无法正确地将属性替换到我的存储库 URL 中这尤其是一个问题因为父 pom 位于远程存储库中所以我需要定义父 pom 最小可重现示例
将 NSNumber 与固定值进行比较？

有没有更好的方法来比较 NSNumber 与固定值只是感觉有点笨拙 if myNumber isEqualToNumber NSNumber numberWithInt 0 NSLog Zero 我确实知道我可以使用 compare 但它
P5.js curveVertex 函数在某个点闭合

我创建了一个噪声函数它与一个圆函数配对创建一个看起来很酷的随机噪声圆我的问题是curveVertex除了第一个和最后一个顶点的连接之外 P5 js 中的函数工作正常我的代码是 let start Array 50 fill 0 do
如何调暗父 UIView（50% 透明）以进行登录？

我有一个带有登录按钮的视图单击该按钮时我添加一个包含登录字段的视图发生这种情况时我需要调暗父视图我怎么做到这一点 UIViews有一个名为mask mask永远会在最上面UIView谁拥有它所以你的方法应该是这样的这是针对
知道为什么 ctags 不会在 Cygwin 上递归吗？

每次运行时我都会收到正在跳过 XXX 它不是常规文件 ctags R XXX 由于某种原因 Cygwin 上的 ctags 不是递归目录当然我一定是做了一些愚蠢的事情每当我尝试事实上的标准时ctags R在我的项目根目录中它抱怨我
为什么使用 KML 数据检索 Android 版 Google 路线不再起作用？ [复制]

这个问题在这里已经有答案了可能的重复谷歌地图输出 kml 坏了 https stackoverflow com questions 11680872 google maps output kml broken 几天以来当我尝试使用 K
python: u'{' 代表什么？

当我打印出一个值时它有一个u在它前面我认为它是某种类型符号它是什么我在哪里可以找到此类符号的列表这意味着UNICODE 字符串文字 http docs python org howto unicode html unicode l
设置 MapView 的中心坐标不考虑 MapView 的完整尺寸（屏幕外部分）

问题我有一个包含全屏 MKMapView 的视图 MapView 的下半部分被 TableView 覆盖该 TableView 具有半透明单元格以便地图显示出来当我以注释坐标例如当前位置为中心时注释视图会被 TableView
与 lambda 和函数式接口一起使用时理解下界的问题

在学习 Java8 Streams 时我遇到了以下代码片段 Predicate
从经典 Asp 返回对象

我正在使用 Classic Asp 构建对 url 的请求现在成功了是我想从函数返回 Request 对象并获取以下内容问题对象不支持此属性或方法我该怎么做 Set objSrvHTTP Server CreateObject M
属性查找 str 和 object.myvar 等对象

我想知道如何将对象字段与变量连接起来这很难向我解释让我举个例子 Example 我的对象有 myobject name Red myobject lastname Foo 我有一个这样的函数 my function some dumb
在jsf-2.2中的faces-config中传递redirect-param

在旧的 jsf 中以下代码可以正常工作
gtk.Builder() 和多个空地文件中断

我有一个glade gui 我也想使用glade 文件插入另一个对象当我按照下面的方式执行此操作时这本质上就是我正在做的事情整个应用程序挂起 self show 并将 CPU 最大化至 100 如果我替换一个的第一行init 和 se
Jquery datepicker - 仅日期和月份

我希望用户在表单中指定他们的生日或周年纪念日不包括年份为此我想使用 jquery datepicker 但它根本不应该显示任何年份选项怎么做我尝试修改代码这样的问题 https stackoverflow com question
如何用FitToView控制页面和组件之间的距离？

使用FitToView后页面和组件之间的距离太近有什么好的方法可以控制这个距离吗在此输入图像描述 https i stack imgur com 7yxqV png 您可以获取对象组件的边界框并用该框放大缩小以形成适当的框并调
完全随机的一次性加密本

我需要创建一个一次性密码本来加密一些数据大小为几KB 我应该如何生成这个一次性填充以避免与基本随机数生成相关的所有伪随机问题例如rand 是否有现有的值得信赖的工具或库可供我使用大多数现代操作系统都有一个加密安全的伪随机数生成器 h
Python 在文本文件中搜索确切的单词/短语

目前我正在尝试在文本文件中搜索确切的单词短语我正在使用Python 3 4 这是我到目前为止的代码 import re def main fileName input Please input the file name lower

Python 在文本文件中搜索确切的单词/短语

Python 在文本文件中搜索确切的单词/短语 的相关文章

随机推荐

热门标签

Python 在文本文件中搜索确切的单词/短语的相关文章