使用python提取一个句子

2024-01-12

如果该句子中存在特定单词,我想提取确切的句子。谁能告诉我如何用 python 做到这一点。我使用了 concordance() 但它只打印单词匹配的行。


快速提醒一下:断句实际上是一件非常复杂的事情,句号规则也有例外,例如“先生”。或“博士”。还有各种句尾标点符号。但例外也有例外(例如,如果下一个单词大写且不是专有名词,则 Dr. 可以结束句子)。

如果您对此感兴趣(这是自然语言处理主题),您可以查看:
自然语言工具包 (nltk)朋克特模块 http://nltk.org/api/nltk.tokenize.html#module-nltk.tokenize.punkt.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用python提取一个句子 的相关文章

  • 如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块?

    我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时 也是由 CDK 创建的 这是我的 CDK 堆栈代码 fr
  • 使用 python 进行串行数据记录

    Intro 我需要编写一个小程序来实时读取串行数据并将其写入文本文件 我在读取数据方面取得了一些进展 但尚未成功地将这些信息存储在新文件中 这是我的代码 from future import print function import se
  • python 中的代表

    我实现了这个简短的示例来尝试演示一个简单的委托模式 我的问题是 这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
  • 如何迭代按值排序的 Python 字典?

    我有一本字典 比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键 换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
  • 如何使用 imaplib 获取“消息 ID”

    我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好 所以我认为 Message ID 是正确的 但我不知道如何获取它 我只知道 imap fetch uid XXXX 有人有解决方案吗 来自 IMAP 文档本身 IMAP4消息号
  • Django 模型在模板中不可迭代

    我试图迭代模型以获取列表中的第一个图像 但它给了我错误 即模型不可迭代 以下是我的模型和模板的代码 我只需要获取与单个产品相关的列表中的第一个图像 模型 py class Product models Model title models
  • 以同步方式使用 FastAPI,如何获取 POST 请求的原始正文?

    在中使用 FastAPIsync not async模式 我希望能够接收 POST 请求的原始 未更改的正文 我能找到的所有例子都显示async代码 当我以正常同步方式尝试时 request body 显示为协程对象 当我通过发布一些内容来
  • 使用 OLS 回归预测未来值(Python、StatsModels、Pandas)

    我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
  • 如何通过在 Python 3.x 上按键来启动和中断循环

    我有这段代码 当按下 P 键时会中断循环 但除非我按下非 P 键 否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
  • 从 python 发起 SSH 隧道时出现问题

    目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道 我已经在我的服务器之间设置了公钥身份验证 因此它们只需直接登录而无需密码提示 怎么办 我试过帕拉米科 它看起来不错 但仅仅建立一个基本的隧道就变得相当复杂 尽管代码示例将受
  • 如何设置 Celery 来调用自定义工作器初始化?

    我对 Celery 很陌生 我一直在尝试设置一个具有 2 个独立队列的项目 一个用于计算 另一个用于执行 到目前为止 一切都很好 我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类 每个工作人员一个 id 我想知
  • Seaborn Pairplot 图例不显示颜色

    我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常 但由于某种原因 图例不会显示相关的颜色 我无法找到解决方案 因此如果有人有任何建议 请告诉我 x sns pairplot stats2 hue
  • 将 matplotlib 颜色图集中在特定值上

    我正在使用 matplotlib 颜色图 seismic 绘制绘图 并且希望白色以 0 为中心 当我在不进行任何更改的情况下运行脚本时 白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色 关
  • Pandas 根据 diff 列形成簇

    我正在尝试使用 Pandas 根据表示时间 以秒为单位 的列中的差异来消除数据框中的一些接近重复项 例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
  • 将 2D NumPy 数组按元素相乘并求和

    我想知道是否有一种更快的方法 专用 NumPy 函数来执行 2D NumPy 数组的元素乘法 然后对所有元素求和 我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
  • 使用 Firefox 绕过弹出窗口下载文件:Selenium Python

    我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
  • mac osx 10.8 上的初学者 python

    我正在学习编程 并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程 虽然我看到了 Ruby 和 Rails 的优点 但我觉得我需要一种更容易学习编程概念的语言 因此是 Python 但是 我似乎找不到适用于
  • 具有自定义值的 Django 管理外键下拉列表

    我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
  • Elastic Beanstalk 中的 enum34 问题

    我正在尝试在 Elastic Beanstalk 中设置 django 环境 当我尝试通过requirements txt 文件安装时 我遇到了python3 6 问题 File opt python run venv bin pip li
  • Scrapy Spider不存储状态(持久状态)

    您好 有一个基本的蜘蛛 可以运行以获取给定域上的所有链接 我想确保它保持其状态 以便它可以从离开的位置恢复 我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

  • 在 Laravel 4 中将数据传递给闭包

    我正在尝试使用 Laravel 4 中的 Mail 类 但无法将变量传递给 m 对象 team 对象包含我用 eloquent 从数据库中获取的数据 Mail send emails report data function m m gt
  • 使用 C++ 从 OSX 中的 HIDManager 获取鼠标事件

    我正在将游戏从 PC 移植到 osx 但我遇到了输入事件的问题 主游戏窗口是一个与 C 后端交互的可可应用程序 PC 代码使用 DirectInput 和 Windows 消息来生成游戏可以理解的键盘和鼠标事件 当我第一次启动该端口时 我用
  • 逗号运算符什么时候有用?

    I read this https stackoverflow com questions 3561043 javascript syntax what comma means关于表达式中 逗号运算符 的问题 和MDN docs https
  • 使用 lodash 在另一个数组内的数组中查找值

    我有一个数组 例如 var db words word1a word1b word1c answer answer1 words word2a words2b answer answer2 我在 node js 上使用 lodash 来检查
  • 在谷歌云存储上上传图像时文件大小为零字节---nodejs?

    这是我的代码 const fs require fs const uuidv4 require uuid v4 const Storage require google cloud storage const CLOUD BUCKET pr
  • SQL繁琐添加数组作为参数

    我正在运行这个 SQL 查询tedious js使用参数 var query select from table name where id in ids request new sql Request query function err
  • Laravel Pluck 但结合名字+姓氏进行选择

    在 Laravel Vue 项目中使用 select2 并需要返回以下格式的 JSON id 0 text enhancement id 1 text bug 在 Laravel 中 我知道我可以使用 pluck 来创建列表数据 例如对于客
  • Google 地图信息窗口关闭按钮被隐藏

    我在我的网站中使用了带有多个标记和多个信息窗口的 Google 地图 不知何故 关闭按钮 小x 隐藏在信息窗口内 但如果在应显示的位置单击则可以使用 如何解决这个问题 修复了它 显然 bootstrap css 与图像冲突 必须使用这几行额
  • 如何区分 Google Fit Api 中手动添加的步数和传感器记录的步数

    我在我的项目中使用 Google Fit Api 来获取用户的每日步数 但问题是 用户可以通过添加活动来手动输入步骤 当我检索每日步数时 Google Fit Api 还会返回手动添加的步数 有什么方法可以区分手动添加的步骤和传感器记录的步
  • 适用于 Linux 的 C++ 对象序列化

    我正在编写一个需要通过网络发送和接收数据的程序 我从来没有处理过对象序列化 我读到了一些关于 Boost 和 Google Protocol Buffers 的建议 在 Linux 中使用哪个最好 如果您知道其他人 我将感谢您的帮助 Tha
  • Redis、StackExchange、与 MGET 配合使用,一次获取多个密钥

    有没有办法将 MGET 与 StackExchange Redis C 一起使用 我需要一种方法可以在一次通话中重奏多个按键 可以使用下一个方法 Task
  • 是什么让Python中的东西变得可迭代

    是什么让 Python 中的东西变得可迭代 IE 可以循环它for 我可以用Python创建一个可迭代的类吗 如果是这样 怎么办 要使类可迭代 请编写 iter 返回迭代器的方法 class MyList object def init s
  • CUDA - 如果我选择太多块怎么办?

    我仍然对这些未知大小的矩阵感到生气 每个维度可能在 10 20 000 之间变化 我正在查看 CUDA sdk 并想知道 如果我选择的块数量太高怎么办 就像 X 和 Y 维度上 9999 x 9999 块的网格一样 如果我的硬件具有无法容纳
  • git checkout my_branch 与 git checkout origin/my_branch

    我当时在branch1当我结帐时branch2像这样 两个分支都存在 git checkout origin branch2 然后我得到了一个分离头错误 You are in detached HEAD state You can look
  • 根据给定的 OpenApi/Swagger 规范验证请求负载和响应

    我们有一个 HTTP API 它是用Python 的拥抱框架 http www hug rest 但这并不是一成不变的 将来可能会被其他东西取代 在它旁边 我们手动写了一个OpenApi Swagger 2 0 规范文件 https git
  • 如何设置log4j属性文件?

    我有一个使用 log4j 的 Eclipse Java 项目 我无法将log4j配置文件设置为通过文件路径访问 我必须在 jar 中导出并运行该项目 这是我的尝试 public class Wita static Logger logger
  • ROR-使用回形针逐步生成多个图像

    我已经使用了 教程 here http sleekd com rails adding multiple images to a rails model with paperclip 但由于某种原因它不起作用 任何人都可以给我一个使用其他表
  • 如何每天自动从 git 存储库更新我的服务器文件

    我是这些服务器相关工作的菜鸟 我正在本地系统中编写一些 PHP 代码 并定期更新 github 中的存储库 每次我想测试我的应用程序时 我都会通过 FTP 将本地系统中的所有文件复制到我的服务器上 然后进行测试 现在我想知道是否有一种方法可
  • 服务和组件属性之间的 Angular2 数据绑定

    我需要对服务和组件属性之间的绑定以及 Angular2 中的数据绑定进行一些澄清 假设我有一个服务 单例 和一个组件 export class Service name Luke object id 1 getName return thi
  • 使用python提取一个句子

    如果该句子中存在特定单词 我想提取确切的句子 谁能告诉我如何用 python 做到这一点 我使用了 concordance 但它只打印单词匹配的行 快速提醒一下 断句实际上是一件非常复杂的事情 句号规则也有例外 例如 先生 或 博士 还有各