第一句话正则表达式

2023-12-10

我正在使用正则表达式(与 php/perl 兼容)来从某些文本中获取第一句话。我意识到,如果涵盖所有案例,这可能会变得巨大,但只是在目前“足够好”的事情之后。有人为此准备了现成的东西吗?


最终,您需要的是自然语言解析,这是极其困难的,并且单独使用正则表达式(甚至是超级增强的 PCRE)可能是不可能的。考虑这句话:

Regex 先生和他的句子匹配就到此为止。

到目前为止给出的每个答案都会将其解析为两个句子,这甚至不是一个边缘情况 - 想象一个以“亲爱的亚当斯先生:”或类似内容开头的文本块是相当合理的。您可以添加后向检查来检查标点符号之前的单词是什么,但这将变得难以维护,因为您必须检查所有可能的缩写。你必须检查先生和例如和公司。和圣以及许多其他你永远不会想到的。一段时间后,你可能会得到一个“相当不错”的实用解决方案,但它会很丑陋,有一天它会失败。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

第一句话正则表达式 的相关文章

  • 如何使正则表达式匹配不区分大小写?

    我有以下正则表达式加拿大的邮政编码 http en wikipedia org wiki Postal codes in Canada ABCEGHJKLMNPRSTVXY 1 d 1 A Z 1 d 1 A Z 1 d 1 它工作正常 但
  • 如何编写 Clojure 宏来从字符串创建正则表达式?

    我正在创建一个方便的宏 部分便利在于可以仅使用字符串来指定正则表达式 而不是使用 re 表示法 我无法弄清楚的一部分是如何让宏获取字符串并将其重写为 Clojure 正则表达式 例如 生成 re 符号 我认为这是一个语法 转义问题 我的第一
  • 如何使用正则表达式将字符串分成相同字符的组?

    我有一个这样的字符串 var string AAAAAAABBBCCCCCCDD 并喜欢将字符串分割成这种格式的数组 same characters gt same group 使用正则表达式 Array AAAAAAA BBB CCCCC
  • laravel - 使用请求类或输入类

    在宁静的控制器中 我应该使用哪个类来获取传递的变量 member gt email Input get email or member gt email Request get email 两种选择都适合我 但有什么区别 Input get
  • 正则表达式 数字字符串 数字字符串循环

    我的字符串是 str Move 10 Casio Watch 20 Apple Iphone 100 Apple Macbook to store 我用过了 preg match all 0 9 str matches 但它只匹配产品名称的
  • 如何对 SQL 进行多次查询

    我正在尝试创建一个表 并在 PHP 脚本的帮助下在数据库中插入一些值 虽然只插入 1 行 但效果很好 当我尝试输入更多行数时 出现错误 我需要为每个查询编写完整的插入语句 因为我正在使用在线 Excel 到 SQL 查询转换器
  • 如何隐藏 URL 中的锚标记

    如何隐藏地址栏中以下链接 href 的哈希值 a href index php dev name 所以它会将我重定向到index php dev name 但我希望地址栏只显示index php 您可以使用 Javascript oncli
  • CodeIgniter 控制器 - JSON - AJAX

    我正在尝试通过 AJAX 使用 CodeIgniter 发送表单构建 并尝试使用 JSON 获取响应 但是 我只在打开开发人员选项卡时看到响应 我什至不确定这是否实际上是响应 因为它显示了两个 json 数据 它所显示的只是加载旋转器 然后
  • 获取字符串中的最后一个整数

    我需要隔离包含多个整数的字符串中最新出现的整数 我怎样才能得到23代替1 for lastnum1 text 1 out of 23 lastnum1 this gt getEval eregi replace out of text 你可
  • 访问sendBeacon发送的数据

    文档表明sendBeacon通过发送其数据HTTP POST request 但在 PHP 中 POST变量似乎是一个空数组 这是我的 JavaScript 代码 navigator sendBeacon beacon log php My
  • 在 Yii 的标准中如何获得计数 (*)

    我正在尝试构建一个具有以下内容的查询group by属性 我正在尝试得到id和count它一直告诉我count is invalid列名 我怎样才能得到count来自group by询问 工作有别名 伊伊 1 1 11 其他不及格 crit
  • 检测两个正则表达式是否可能匹配相同的字符串[重复]

    这个问题在这里已经有答案了 给定两个正则表达式 是否可以检测是否存在与它们都匹配的可能字符串 例如 给定正则表达式A and 我可以看到那个字符串 A 匹配他们两个 这是一个简单的案例 我的问题是针对更广泛的情况 给定任何两个有效的正则表达
  • 如何通过ssh检查ubuntu服务器上是否存在php和apache

    如何通过ssh检查Ubuntu服务器上apache是 否安装了php和mysql 另外如果安装的话在哪个目录 如果安装了其他软件包 例如 lighttpd 那么它在哪里 确定程序是否已安装的另一种方法是使用which命令 它将显示您正在搜索
  • 我可以在 PHP 会话变量中安全地存储用户名和密码吗?

    我想在 REST api 之上制作一个轻量级的 web 应用程序 用户只需进行一次身份验证 从那时起 所有针对 web api 的请求都希望通过以某种方式保持用户名和密码有效来完成 我已经做了一个工作原型我在哪里将用户名和密码存储在会话变量
  • 如何使用 php 在 sql 查询中转义引号?

    我有一个疑问 sql SELECT CustomerID FROM tblCustomer WHERE EmailAddress addslashes POST username AND Password addslashes POST p
  • 使用FFMpeg确定视频类型,然后进行转换?

    我正在尝试以编程方式确定文件的真实类型 看来我必须使用 FFMPeg 来实现这一点 我想确定上传的文件实际上是否是 MP4 或 FLV 对于 Flash 视频 或 WebM 对于 HTML5 我知道 FFMPeg 中的 i 运算符 但我不知
  • PHP递归遍历对象树[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 如何在 gulp.src 中使用基本正则表达式?

    我正在尝试选择两个文件gulp src highcharts js and highcharts src js 当然 我知道我可以使用数组表达式显式添加这两个表达式 但出于学习目的 我尝试为它们编写一个表达式 我读过可以使用简单的正则表达式
  • 使用 PHP 将 latin1_swedish_ci 转换为 utf8

    我有一个数据库 里面充满了类似的值 Dhaka 应该是 Dhaka 因为我在创建数据库时没有指定排序规则 现在我想修复它 我无法从最初获取数据的地方再次获取数据 所以我在想是否可以在 php 脚本中获取数据并将其转换为正确的字符 我已将数据
  • 使用 crypt() 加密

    我目前正在做一个非常安全的登录系统 但我是 crypt 函数的新手 需要一些快速帮助 我在注册过程中使用 crypt 加密密码字符串并将其保存到数据库中 但是 我如何在登录过程中解密密钥 或者我应该怎么做 或者是否可以对提交的密码字符串进行

随机推荐

  • 为什么在JavaScript中类A的instanceof函数,但typeof类A不是一个对象?

    当我们说 实例 时 我们假设我们正在处理一个对象 为什么使用 JavaScript 的运算符instanceof回报true当我们问 class A instanceof Function but typeof class A functi
  • 对数组中的所有元素调用函数

    假设我有一个函数 例如 function result Square x result x x end 我有一个如下所示的数组 x 0 0 1 1 我想要一个y数组 存储了的平方x正在使用我的Square功能 当然 一种方法是以下 y ze
  • IIS 中的 ODP.NET 错误:ORA-12357 网络会话文件结束

    我正在尝试将 MVC 应用程序部署到连接到 Oracle 数据库的 IIS 服务器 为此 我下载了 Visual Studio 2013 的 ODAC 扩展 并使用 Nuget 将最新的 ODP NET 托管客户端安装到项目中 我的开发机器
  • iOS - 我可以在使用 Callkit 接听电话时打开 VoIP 应用程序吗?

    我计划创建一个 iOS VoIP 应用程序 之前没有制作过任何 iOS 应用程序 我正在读关于Callkit在IOS中 可以让他的应用程序通过iPhone本机通话屏幕接听电话 I read 调用接口 here其中提到可以知道呼叫是否被应答
  • 如何列出我已签出的所有包裹?

    我正在多用户环境中工作 并使用 CVS 共享模型 该模型很大 有很多包 有时 我会在没有意识到的情况下签出一个包 从而阻止其他人使用该包 有什么方法可以列出我已签出的所有软件包 以便我可以签入不需要的软件包吗 Enterprise Arch
  • 将小 PS 脚本转换为 .BATch 文件中的长行

    我有从答案中得到的 PowerShell 代码这个问题 它显示 PS 代码运行的 cmd exe 窗口的位置 尺寸 WindowFunction RectangleStruct Add Type MemberDefinition DllIm
  • Android:使用 RandomAccessFile 从内部存储访问文件

    我正在创建一个需要从文件读取数据的应用程序 我最初是使用 a 来从资产文件夹中读取它的BufferedReader and an InputStreamReader但我遇到了内存问题 请参阅Android 文件读取 内存不足问题 一项建议是
  • 使用 Boost PTree 解析 XML(不带标签)

    我想知道 Boost Ptree 是否允许在不知道属性标签的情况下解析 xml 文件 我有一个 XML 文件 它将定期更新新标签 新数据 甚至删除某些标签 这些定期更改促使我考虑在不硬编码属性名称的情况下解析文件 有什么方法可以读取 XML
  • 将 nvarchar 值“Internet Explorer 3 原始”转换为数据类型 int 时转换失败

    在 SQL Server 2008 TSQL 中 我创建了一个如下的存储过程 CREATE PROCEDURE SP 1 10 2 AS declare mostValuableBook nvarchar 255 SELECT mostVa
  • 无法使用 Selenium WebDriver 和 Java 打开 IE11 驱动程序实例

    System setProperty webdriver ie driver C Users IEDriverServer Win32 2 45 0 IEDriverServer exe WebDriver driver new Inter
  • 如何创建和访问共享应用程序组文档目录?

    我正在使用自定义键盘扩展 然后从服务器下载键盘主题并保存到应用程序文档目录 但应用程序文档目录无法在自定义键盘扩展中访问 因此需要共享应用程序组目录 我该怎么办请帮助我 现在我正在尝试这个 但它不起作用 let fileManager Fi
  • 在 Worker 的帮助下从 Spark 读取巨大的 MongoDB 集合

    我想从 Spark 读取一个巨大的 MongoDB 集合 创建一个持久的 RDD 并对其进行进一步的数据分析 有什么办法可以更快地从 MongoDB 读取数据 尝试过MongoDB Java Casbah的方法 我可以使用worker sl
  • CakePHP 条件查询,控制器为“hasAndBelongsToMany”

    我为这个可怕的标题道歉 我不知道如何解释我的问题 在我的数据库中 我有以下表格 articles tags and articles tags 一篇文章可以有多个标签 目前 我可以获取所有带有所有标签的文章 但我希望能够根据其标签查找文章
  • SVN 到 Git 迁移后如何列出和获取远程分支? [复制]

    这个问题在这里已经有答案了 我将 SVN 存储库迁移到 Git 并将其推送到中央存储库 我们有相当数量的标签和分支 但不知何故 我们无法从 Git 客户端列出和获取它们 这很奇怪 因为标签和分支似乎在服务器上可用 在一个人的帮助下乔恩 马多
  • 如何在 sails 控制器中获取当前套接字对象或 id?

    我想访问当前连接的套接字 IDsails js v0 12 控制器功能 sails sockets getId req socket 显示未定义 因为这不是套接字请求 我的目标是在用户成功登录后在数据库中设置用户的在线状态 login fu
  • 已弃用的“EAGLContext”的解决方案是什么?

    我想为我的应用程序使用本机过滤器 该功能可以工作 但我想避免从文档中删除的方法 我搜索整个互联网并没有解决方案 我搜索整个互联网 但没有找到任何解决我的问题的方法 public func applyFilterTo image UIImag
  • 根据需求添加带有可变参数的.Net Core策略

    我正在尝试实施一项非常细粒度的政策 这个想法就像图中一样 每个实体始终具有一对多与右侧实体的关系 一机构可以有很多Courses each Course可以有很多Subjects each Subject可以有很多Syllabus etc
  • 如何将获取请求参数传递到我的 Velocity 模板以发送邮件

    我有一个 JSP 在该 JSP 中我有一个看起来像这样的链接 现在 当用户单击该链接时 它会转到我的velocityview servlet 现在我的问题是如何提取velocityview servlet 中的这些参数并将其放入上下文中 以
  • 字符文字错误中字符过多

    我正在创建一个时尚的文本应用程序 但在某些地方我收到错误 字符文字中的字符太多 我只写了一个字母 但当我粘贴时 它会转换成许多字母 如下所示 uD83C uDD89 原始字母是 请告诉我如何以正确的方式写这个 for int charOne
  • 第一句话正则表达式

    我正在使用正则表达式 与 php perl 兼容 来从某些文本中获取第一句话 我意识到 如果涵盖所有案例 这可能会变得巨大 但只是在目前 足够好 的事情之后 有人为此准备了现成的东西吗 最终 您需要的是自然语言解析 这是极其困难的 并且单独