如何在字符串中查找专有名词?

2024-02-01

我正在尝试识别用户提交的 3-4 句话段落中的专有名词。我同意该功能存在一些缺陷,因为我有一个审核团队来验证几乎所有内容。

下面是传入段落的示例。

尼克·斯威舍 (Nick Swisher) 击出詹姆斯·希尔兹 (James Shields) 击出全垒打,在第一局打出五分,周二晚上,纽约洋基队 (New York Yankees) 以 8-3 击败坦帕湾队 (Tampa Bay),在美联东区领先光芒队 (Rays) 2 1/2 场。

我希望该函数取出以下关键字/专有名词。

尼克·斯威舍、詹姆斯·希尔兹、纽约洋基队、坦帕湾队、光芒队、美联东区

我想我可以分解字符串并用空格分隔单词。然后我会检查每个单词,看看第一个字母是否大写。如果是,请将其退回。如果没有,请继续下一个单词。

但是多词关键字/专有名词呢?如何获得在已找到的第一个字母上限单词之后检查单词的功能?

所以该函数会找到 Nick,但我如何告诉它也检查下一个单词呢?因此,请检查 next 是否有上限,如果有,则返回 Nick Swisher。如果没有,就返回尼克。

更进一步,如果它是一个 3 个词的短语怎么办?找到了新的,找到了约克,我怎样才能找到洋基队呢?


尝试像这样的正则表达式:

[A-Z]{1,1}[a-z]*([\s][A-Z]{1,1}[a-z]*)*

但请务必检查区分大小写

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在字符串中查找专有名词? 的相关文章

  • 在 PHP 中接受带有小数点和千位分隔符的国际数字

    对于用户可以输入能量值来计算相应费用的在线计算器 我需要 PHP 脚本来接受各种用户输入 200 万又四分之一焦耳 的值可以输入为 2000000 25 默认表示法 2 000 000 25 带千位分隔符 2000000 25 逗号作为小数
  • PHP 共享标头而不使用服务器端脚本?

    到目前为止我总是通过 PHP 解决简单的问题 您有一个包含页眉 菜单 页脚和内容字段的网站 每个页面的页眉 菜单和页脚通常是相同的 在没有 PHP 或任何其他服务器端语言的情况下 如何使页眉 菜单和页脚数据仅存在于一个文件中 例如 您不会有
  • 使用 PHP 中的 GD 库在图像上绘图

    我创建了一个代码来生成随机图案图像 它创建一个具有给定宽度和高度的图像 并用 40x40 像素的小矩形填充它 这是我的代码
  • 使用 MYSQL 将 h:mm pm/am 时间格式插入数据库

    我正在尝试将以 h mm am pm 格式写入的时间插入到存储为标准 DATETIME 格式 hh mm ss 的数据库中 但我不知道如何将发布的时间转换为标准格式所以数据库会接受它 这是我到目前为止一直在尝试的 title POST in
  • PHP条件,如果当前页面,则链接突出显示[关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 我有一个带
  • 通过 Sparkpost 发送 iCal 邀请

    我正在尝试使用 SparkPost 通过电子邮件以附件形式发送日历邀请 但收到电子邮件后邀请不会打开 我使用两个文件 calendarinvite php 来创建邀请 使用 Sendemail php 来发送电子邮件 calendarinv
  • 更改 Woocommerce 中“我的帐户”页面上的标题

    我见过大量有关如何使用 WooCommerce 我的帐户仪表板重新排序 更改导航和页面的示例 但我一生都无法弄清楚如何更改每个部分的主要标题 我的帐户 订单 下载 地址等 我已经搜索过模板 但没有任何乐趣 我尝试使用条件 php 注释来回显
  • Ajax 没有将我重定向到下一页

    我正在尝试将单击的图像的 ID 传递到下一页 当我开发代码时 它没有将我重定向到下一页 当我单击 F12 并检查网络中的 POST 时 它显示变量已正确传递到下一页 如附图所示 但它没有将我重定向到下一页 所以现在我知道变量在下一页中正确传
  • 使用 ImageMagick 和 PHP 将 PNG 转换为 JPG 并将透明背景设置为白色

    将图像从 PNG 转换为 JPEG 时 如何使用 ImageMagick 带有 php 扩展 将透明背景设置为白色 在撰写本文时 您尚未指定正在使用哪个扩展 但如果您使用命令行 则命令将是 convert image png backgro
  • 如何关闭未关闭的 HTML 标签?

    每当我们从数据库或类似来源获取一些经过编辑的用户输入内容时 我们可能会检索仅包含开始标记但不包含结束标记的部分 这可能会妨碍网站当前的布局 有客户端或服务器端的方法来解决这个问题吗 找到了一个很好的答案 使用 PHP 5 并使用 DOMDo
  • 如何在多次尝试后延迟登录尝试 (PHP)

    我正在开发一个用 PHP 构建的相当大的网站 该网站可能会有很多用户 我正在寻找一种方法来保护登录屏幕免受自动尝试的影响 我已经在注册表中添加了验证码检查 但还想进一步强化网站 据我所知 StackOverflow 上也有类似的问题 而且我
  • WordPress 包含 SVG 文件错误

    我使用 PHP 和 WordPress 在本地主机上 我可以毫无问题地包含 SVG 文件 但在实时服务器上 我尝试包含一个 SVG 文件以便能够使用 CSS 对其进行样式设置 我收到此错误消息 Parse error syntax erro
  • PHP 中的引用

    我正在编写一个自定义博客引擎 并且希望拥有类似于 Wordpress 的引用 我可以查看 WordPress 源代码 但我真的更喜欢某种教程 但到目前为止我还没有找到 有没有关于在 PHP5 中实现 trackbacks 或 pingbac
  • 如何将 Smarty 3 包含到 Laravel 4 中?

    我是 Laravel 的新手 所以仍在习惯这些概念 但是我有大约 10 年的使用 Smarty 的经验 所以我希望利用这一点 除了事实上 Blade 似乎缺乏太多我发现有用且在 Smarty 中开箱即用的功能 但无论如何除了这个问题的要点之
  • 如何删除文件

    我们有一个脚本 scripts ourscript php和一个文件 media movie1 flv 当我们运行时 我们如何删除这个文件ourscript php Using unlink http php net manual en f
  • WordPress 自定义帖子类型未显示在搜索结果中

    我在 WordPress 中遇到自定义帖子类型 测验 和搜索的问题 自定义帖子类型未显示在我的搜索结果页面中 我的搜索结果中仅显示默认的帖子内容 以下是我使用的代码 函数 php函数create posttype register post
  • 从所有会话中注销

    我有一个注销选项 这是我的代码 session start session destroy setcookie key time 60 60 24 setcookie username time 60 60 24 我想添加另一个选项来注销所
  • 我可以在 PHP 会话变量中安全地存储用户名和密码吗?

    我想在 REST api 之上制作一个轻量级的 web 应用程序 用户只需进行一次身份验证 从那时起 所有针对 web api 的请求都希望通过以某种方式保持用户名和密码有效来完成 我已经做了一个工作原型我在哪里将用户名和密码存储在会话变量
  • 反向引用在 PHP 中不起作用

    最近我一直在研究 更多的是在实践中说实话 正则表达式 我注意到他的力量 我提出的这个要求 link https stackoverflow com questions 30380397 take the text up to a speci
  • 如何使用 php 在 sql 查询中转义引号?

    我有一个疑问 sql SELECT CustomerID FROM tblCustomer WHERE EmailAddress addslashes POST username AND Password addslashes POST p

随机推荐

  • 水晶报表 - 如果包含图表,则数据重复

    我们使用 Crystal Reports XI R3 来实现报告目的 我们创建了类型化数据集作为报告的数据源 我面临的问题包括其中一份报告上的条形图和网格 默认情况下 图表嵌入到标题部分 网格是从详细信息部分生成的 如果我设计没有图表的报告
  • Heroku“进程已退出,状态为 137”node.js 应用程序

    我最近发布了有关类似主题的问题 我对 URL 上的所有内容进行了重大修改 并且发生了与上次相同的事情 我可以部署所有内容并使用以下命令运行它heroku local web 当我访问网络测功机时 它说我遇到了应用程序错误 然后我检查了日志
  • 当参数有时可以为NULL时如何参数化SQL查询?

    With pyodbc我可以像这样参数化查询 value testval query SELECT FROM TestTable WHERE Column cursor execute query value 但问题是 如果value为 N
  • 当 Perl 中发生警报时,我应该如何清理挂起的孙进程?

    我有一个并行自动化脚本 需要调用许多其他脚本 其中一些脚本挂起 因为它们 错误地 等待标准输入或等待各种其他不会发生的事情 这没什么大不了的 因为我抓住那些alarm http perldoc perl org functions alar
  • VisualSVN 预提交规则

    将此挂钩与 VisualSVN Server 结合使用 作为 pre commit bat 添加到 Repository hooks 文件夹中 我的问题是如何添加注释必须始终以数值开头的规则 我希望评论的第一部分始终是错误跟踪器的问题号 例
  • 从 PDF 中搜索文本的脚本

    Problem 在 Mac OS X 平台上 我想用 Python 或 Tcl 编写一个脚本来搜索 PDF 文件中的文本并提取相关部分 我很感激任何帮助 背景 我正在编写脚本来查看 PDF 中的内容 以确定它是否是账单 来自哪家公司以及持续
  • 如何更改 IPython Notebook 中显示方程的对齐方式?

    我希望我的 MathJax 在 IPython Notebook 中显示的方程在左侧对齐而不是居中对齐 这是由核心配置选项控制的显示对齐在 MathJax 中 如所述here http docs mathjax org en latest
  • 使用 thymeleaf 请求参数

    在 Spring Boot Web 应用程序中 User想要重置密码 所以他输入Reset password页 现在我想让他输入他的电子邮件地址 pushReset我想重定向到myapp resetPassword email HIS EM
  • UILabel 与 -[sizeWithFont:constrainedToSize:lineBreakMode] 正在切断单词

    UILabel里面的一个UITableViewCell 在手机点击时 高度会扩大 第二个UILabel与不同数量的数据一起出现 问题是 如果换行 sizeWithFont constrainedToSize lineBreakMode 不能
  • 简单形式的 Wiki 或类似 Markdown 的语法?

    有没有类似的简单语言Markdown http en wikipedia org wiki Markdown或其中之一维基标记 http en wikipedia org wiki Wiki markup被转换成 HTML 表单元素 例如
  • 比较 R 中的字符向量以查找唯一值和/或缺失值

    我有两个字符向量 x 和 y x lt c a b c d e f g y lt c a c d e g x 内的值不会重复 即它们都是唯一的 向量 y 也是如此 我的问题是 如何让 R 比较两个向量 然后告诉我 y 相对于 x 缺少哪些元
  • 如何在 Vaadin ComboBox 中添加搜索图标?

    我有一个ComboBox允许选择给定的项目 以及接受选择的图标 功能都很好 我正在寻找将搜索图标放入组合框中的效果 像瓦丁图标 https vaadin com icons 这是怎么做到的 I tried comboBox setIcon
  • 为什么返回未初始化的值被视为未定义行为?

    在读的时候this http en cppreference com w c language behavior UB and optimization我看到一个UB不太明白 希望你能解释一下 size t f int x size t a
  • 如何计算第 n 个排列(或告诉给定排列的字典顺序)? [复制]

    这个问题在这里已经有答案了 这个问题有两个部分 但由于我正在尝试与 Prolog 实现进行比较 解决一个问题可能会立即导致另一个问题的解决方案 给定整数列表的排列 1 2 N 我如何知道字典顺序中该排列的索引是什么 给定一个数字k 我该如何
  • 有什么方法可以避免 vue-test-utils 中的shallowMount内存泄漏吗?

    我们有一个适用于 Node Mocha 和 jsdom 包的 vue 自定义单元测试设置 可模拟浏览器环境 无 webpack karma 我们已经编写了大约 3k 规范 具有数百个组件的大型应用程序 现在当 mocha 运行时 它变得越来
  • 如何读取不完整的表单字段 ncurses C++

    我有一个使用 ncurses C 读取表单字段的代码 但是当表单字段未完全键入时我无法显示值 include
  • 计算列帮助 - TSQL

    CREATE TABLE dbo tblLocations latitude float NOT NULL longitude float NOT NULL location varchar 500 NOT NULL timestamp d
  • Devise登录时如何传递参数

    Devise登录过程中如何传递参数 我有一组用户 每个用户都有自己的个人资料页面 我希望他们能够查看自己的个人资料页面 但不能查看其他用户的个人资料页面 除非他们是管理员 在这种情况下他们可以访问应用程序中的所有内容 我创建了一个 User
  • ZedGraph MajorGrid 和 MinorGrid LineStyle

    我只是想知道是否有人知道如何更改 ZedGraph 的主要和次要网格的线条样式 例如我有 graphPane XAxis MinorGrid IsVisible true 我想要这样的东西 graphPane XAxis MinorGrid
  • 如何在字符串中查找专有名词?

    我正在尝试识别用户提交的 3 4 句话段落中的专有名词 我同意该功能存在一些缺陷 因为我有一个审核团队来验证几乎所有内容 下面是传入段落的示例 尼克 斯威舍 Nick Swisher 击出詹姆斯 希尔兹 James Shields 击出全垒