在javascript中将字符串分割成句子

2024-03-31

目前我正在开发一个将长列分成短列的应用程序。为此，我将整个文本拆分为单词，但目前我的正则表达式也拆分了数字。

我所做的是这样的：

str = "This is a long string with some numbers [125.000,55 and 140.000] and an end. This is another sentence.";
sentences = str.replace(/\.+/g,'.|').replace(/\?/g,'?|').replace(/\!/g,'!|').split("|");

结果是：

Array [
    "This is a long string with some numbers [125.",
    "000,55 and 140.",
    "000] and an end.",
    " This is another sentence."
]

期望的结果是：

Array [
    "This is a long string with some numbers [125.000, 140.000] and an end.",
    "This is another sentence"
]

我必须如何更改我的正则表达式才能实现此目的？我需要注意可能遇到的一些问题吗？或者搜索一下就足够了". ", "? " and "! "?

str.replace(/([.?!])\s*(?=[A-Z])/g, "$1|").split("|")

Output:

[ 'This is a long string with some numbers [125.000,55 and 140.000] and an end.',
  'This is another sentence.' ]

分解：

([.?!])= 捕获任一. or ? or !

\s*= 捕获前一个标记后面的 0 个或多个空白字符([.?!])。这说明了与英语语法匹配的标点符号后面的空格。

(?=[A-Z])= 仅当下一个字符在 A-Z 范围内（大写 A 到大写 Z）时，前面的标记才匹配。大多数英语句子都以大写字母开头。以前的正则表达式都没有考虑到这一点。

替换操作使用：

"$1|"

我们使用了一个“捕获组”([.?!])我们捕获其中一个字符，并将其替换为$1（比赛）加上|。所以如果我们捕获?那么替换将是?|.

最后我们把管道分开|并得到我们的结果。

所以，本质上，我们要说的是：

1）查找标点符号（其中之一. or ? or !）并捕获它们

2) 标点符号后面可以选择包含空格。

3) 标点符号之后，我希望有一个大写字母。

与之前提供的正则表达式不同，这将正确匹配英语语法。

从那里：

4）我们通过附加管道来替换捕获的标点符号|

5）我们分割管道来创建一个句子数组。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

regex

在javascript中将字符串分割成句子的相关文章

通过pm2运行node.js，但经常重新启动：通过信号[SIGINT]以代码[0]退出

我试图在我的系统上运行 node js 但遇到了这个问题 2016 06 01 20 46 28 App app with id 13 and pid 12633 exited with code 0 via signal SIGINT 2
Javascript DOM setAttribute 在函数调用中不起作用

我有一个带有输入元素的 HTML 文件我希望向其中添加一个名为 valid fieldset011 的新属性该属性用作 AngularJS 验证器的链接输入元素具有属性 id fieldset011 如果我使用以下脚本包含在脚本标签
第一次使用node.js - “ReferenceError：节点未定义”

我刚刚安装了node js 我尝试编写应该检查版本的node v 但它不起作用这是输出 gt node v ReferenceError node is not defined at repl 1 2 at REPLServer self
ajaxStop() 不触发

这是不起作用的代码 document ajaxStop function this unbind ajaxStop prevent running again when other calls finish Display everythi
创建一个简单的 10 秒倒计时

我想要一行这样写的 Your download will begin in 10 9 8 etc Beginning on page load seconds 我已经设置了 10 秒下载文本并且我还查看了其他 stackoverflow
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
在鼠标光标位置添加 cytoscape 节点

我想在画布上的单击事件上的鼠标箭头位置添加一个 cytoscape 节点我怎样才能做到这一点我的方法效果不太好我可以通过单击创建一个节点但无法确保创建的节点的位置位于我单击的位置使用这样的东西 cy click function
Chrome 扩展同步调用 - 仅在窗口关闭后创建窗口

我有这个代码 function voteNewWindow mailNum chrome windows create url http www google com incognito true function window conso
将文本大小调整为矩形在 Canvas HTML5 中调整大小

我是 Canvas 新手我正在创建一个网站以在调整矩形大小时增加文本我尝试了很多但没有任何效果实际上我希望如果我仅按其宽度调整矩形大小向左拉伸向右拉伸则仅应增加文本宽度而不是字体大小我已经完成了字体大小但发现增加孤立文
判断一个数字是否能被 3 或 5 整除 (FizzBuzz)

如何根据输出是否能被 3 或 5 整除来更改输出如果它能被 3 整除我想显示 rock 如果它能被 5 整除我想显示 star 类似于 FizzBu zz 如果两者都有他们都会看到这是我的代码 if var n Math floo
console.log() 显示同一对象属性的矛盾值

我想我可能要疯了我使用 console log 来查看对象的状态然后在下一行对同一对象的特定属性执行 console log 并为每个属性获取不同的值我正在使用的代码是 console log this pictures Items
JavaScript 测验在提出所有问题之前结束

我现在正在学习 JavaScript 并且正在创建一个测验我的测验运行正常控制台中没有任何错误但它会跳过问题有时会在回答所有问题之前结束测验即使给出正确答案也会减少时间我不太确定为什么它会这样做因为在我看来它的编码是正确的
在 Fabric.js 中按宽度/高度在另一个画布对象内居中和缩放画布对象

Goal 将一个对象水平和垂直置于另一个对象矩形或组的中心canvas via Fabric js或者通过Javascript保持原始对象的长宽比相同但也不超过父对象的宽度高度比例父对象矩形或组不会居中于canvas元素
Google 地图 API：忽略 DirectionService 请求中的季节性限制

我目前正在开发一张地图其中显示两点之间的最短路线使用不同的交通工具我注意到有时例如在冬季关闭的道路不会被考虑在内我发现我可以使用方向服务下面的代码忽略高速公路收费站和渡轮但我一生都无法弄清楚如何是否可以忽略季节性限制
计算文本选择的 xy 位置

我正在尝试使用 DOM 元素创建自己的文本选择是的我的意思是当您在此元素中选择文本时您会在文本后面看到蓝色背景这个想法是停止默认行为蓝色并使用我自己的元素来完成工作方法是找到选择的 xy 位置然后放置绝对定位的元素我希望能
尝试在 React 应用程序中连接到 MySQL 数据库时，无法读取未定义的属性（读取“查询”）错误

我正在尝试连接到 MySQL 数据库并在单击按钮后在 React 应用程序中运行查询一些它如何给出错误我当前的代码如下所示 import mysql from mysql function App async function sync
IE 中的每个 JavaScript 支持？

我有这个代码
如何使用 jQuery 或 JavaScript 聚焦或标签？

for var i 0 i
Pure Bash 替换捕获组

我有这个示例字符串 test string 13A6 该字符数字可以是从 0 到 9 以及从 A 到 F 我想要这个输出 1 3 A 6 我有这个工作 result echo test string sed s g 我想在没有 sed 的
从输入类型编号获取无效值

我正在使用输入类型数字当它无效时我如何从中获取值例如使用类型编号并仅打印 e 这本身是无效的我正在使用 React 但我认为这个问题非常普遍 onChange event console log event target valu

随机推荐

排除包含另一个列表中的值的列表项

有两个列表 List
如何检测 Node.js 中函数的所有依赖项？

我试图对我的问题有一个大致的了解我需要使用 Node js 编写一个程序该程序应该能够检测函数的所有依赖项 E g function a do something b function b console log Hey This is
使用 msmtp 通过终端发送邮件工作正常，但不适用于 php mail()

最近我在运行 kubuntu 桌面的 ubuntu 12 04 服务器上安装了 msmtp msmtp 的安装工作正常我什至可以使用 gmail 的 smtp 服务器通过终端发送邮件我的问题是虽然可以通过终端发送邮件但它仍然无法使用
如何从文本文件中获取特定行并在android中显示数组列表

我有一个文本文件我能够读取完整内容并将其显示在视图上文本文件的示例格式 userdetail William Bits 6th cross road City house Rio lt 051 22345690 gt lt 002 22
如何清除 dropzone.js dropzone

我开始使用 dropzone js 并遇到了一个小问题我能够上传文件我使用模式弹出窗口来获取文件信息问题是当我返回时我之前上传的文件仍然在放置区域中带有复选标记我想要一个空的拖放区 Ideas 我看到的所有答案都涉及在初始化 d
xlwings Book.save() 错误：Workbook 类的 SaveAs 方法失败

我正在打开一个 Excel 文件wb使用 xlwings 进行一些操作然后尝试将其保存到目录中问题是正常的 xw Book save 偶尔会引发错误对于我继续使用此代码来说至关重要的是我可以相信它不会抛出错误下面的代码给我以下错误
Android 工作管理器：“无法实例化 Worker”

我已经按照Android 开发者的 https developer android com topic libraries architecture workmanager basics workflow有关使用工作线程管理器结构在后台运行
应用商店的演示视频？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我将我的应用程序上传到 itunes connect 我等了几天然后我上传的应用程序被拒绝原因之一是我没有使用我的应用程序的演示视频
JavaScript: 假 ||未定义与未定义 ||错误的

行为的解释是什么运算符逻辑或当与false and undefinedJavaScript 中的两边 1 gt false undefined undefined 2 gt undefined false false 逻辑性OR运算符不
有没有办法访问私有 plsql 过程以进行测试？

我正在开发一个包含大量 plsql 代码的项目并希望向我们的代码库添加更具体的单元测试我喜欢测试的一些过程函数不在包规范中我无法更改它有没有办法访问这些私有 plsql 过程而不将它们添加到规范中到目前为止我唯一的想法是在测
如何在 ColdFusion 中用空/零字节填充字符串以及 MacOS 和 Windows 上的 CF 之间的差异

我无法理解如何用空字节填充 CF 中的字符串在Java中我会这样做 String ZeroPad for int i 0 i lt 32 i ZeroPad ZeroPad 0 String strKey strUsername strP
使用 Unity 和 MVVM 在 WPF 中保留用户凭据

尽管我在 Windows 应用程序中做了类似的事情但我在这方面的表现却很糟糕我正在开发 WPF 应用程序 Prism Unity MVVM 并且刚刚完成登录视图一旦根据 SQL Server 中的表验证了用户的凭据我将执行以下操作
如何将数据从选项卡栏控制器传递到其选项卡之一？

我在故事板中设置了一个 UITabBarController 我想从选项卡栏控制器传递数据字典以在适当的子选项卡中使用这是一个标准的 UIViewController 这似乎是一个很长的问题要回答但我真的不知道从哪里开始我正在寻找最简
如果 cellForRowAtIndexPath 未调用，如何更改 UITableViewCell 外观

我的应用程序中有一个表格视图表视图单元格具有带有图案图像的背景表格视图内容正在发生变化有时只有两三个单元格包含内容信息表格视图会自动将其他单元格添加到屏幕底部问题是这些单元格的背景很清晰但我想让背景与其他单元格相同带有图案图像
使用可选参数来实现向后兼容性是一个好主意吗？

我想知道如何通过使用可选参数来提供向后兼容性在我的程序中我有一个带有函数的接口该函数在整个程序以及许多单元测试中使用对于某些新功能必须将布尔值传递到此函数中如果设置为则会改变其行为false 如果你通过true 您将得到与以前
R - 将数据帧转换为时间序列[重复]

这个问题在这里已经有答案了我有谷歌股票数据它有两列日期每日数据和收盘价即 Google 收盘指数 Date Close 10 11 2013 871 99 10 10 2013 868 24 10 9 2013 855 86
仅使用 .wt 文件恢复 MongoDB

我的电脑崩溃了我可以使用 wt 文件取回我的数据吗旧 MongoDB 中的 wt 文件您可以恢复您的 wt从 Atlas Backup 作为恢复文件夹解压或解压下载的 WiredTiger 文件到本地 MongoDB 首先备份您的
如何为 LinearLayout 制作渐变背景？

我想知道在java 而不是xml 中为LinearLayout制作渐变背景的最佳方法是什么有任何想法吗 Thanks
从类内重定向到操作的正确方法？

背景我有一个项目分为 Webform 和 MVC 谢天谢地正在转向 MVC 我有一个LoginManager包含一个类IRedirectionManager类并根据用户属性已通过身份验证密码过期尚未接受条款调用重定向管理器上的
在javascript中将字符串分割成句子

目前我正在开发一个将长列分成短列的应用程序为此我将整个文本拆分为单词但目前我的正则表达式也拆分了数字我所做的是这样的 str This is a long string with some numbers 125 000 55 an

在javascript中将字符串分割成句子

在javascript中将字符串分割成句子 的相关文章

随机推荐

热门标签

在javascript中将字符串分割成句子的相关文章