开放 NLP 名称查找器培训

2024-01-28

我正在根据在线手册（http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html）构建一个名为：en-ner-person.train 的 15k 行训练数据文档。

我的问题是：在我的培训文档中，我是否包含完整的报告？或者我只包含有名称的行：<START:person> John Smith <END>?

例如，我是否在训练数据中使用整个报告：

<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
A nonexecutive  director has many similar responsibilities as an executive director.
However, there are no voting rights with this position.
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .

或者我是否只在我的培训文档中包含这两行：

<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .

您应该使用整个报告。这将有助于系统学习何时不标记实体，从而提高漏报分数。

您可以使用评估工具 http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html#tools.namefind.eval.tool。保留语料库中的一些句子用于测试，例如总数的 1/10，并使用其他 9/10 句子训练您的模型。您可以尝试使用整个报告进行训练，也可以尝试使用仅包含名称的句子进行训练。结果将表示为准确率和召回率 http://en.wikipedia.org/wiki/Precision_and_recall.

请记住将测试样本与整个报告一起保留，而不仅仅是带有名称的句子，否则您将无法准确测量模型在没有名称的句子中的表现。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opennlp

开放 NLP 名称查找器培训的相关文章

file_get_contents 处理错误的好方法[重复]

这个问题在这里已经有答案了我正在尝试错误处理 file get contents 方法因此即使用户输入了错误的网站它也会回显错误消息而不是不专业的信息警告 file get contents sidiowdiowjdiso 无法打

随机推荐

iPhone 应用程序中的文档文件编辑[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有人请建议我如何在 iPhone iPad 应用程序中编辑 Word 文档我不会在我的应用程序中打开Word文档并更改字体样式和颜色并再
关于应用层和数据库层之间的身份验证的意见

我对一个技术困境感到困惑我们团队中的两个人推荐了两种不同的安全模型每种模型都有优点和缺点绿地看起来像这样我们有一个 ASP NET Web 应用程序与业务层对话与数据库对话需求之一是能够让更高级别的用户将业务层权限委托给其他用
从 jpeg 中删除文本

我有一个包含 alpha 混合文本的 jpeg 知道字体和大小后我推导出一个代表文本的 png 文件使用 ImageMagick 我可以获得原始图片的近似值吗实现此目的的一种方法是使用一种称为修复的技术您可以在 Python Ski
了解 iOS 崩溃 [SIGABRT ABORT]

我刚刚收到来自 Crashlytics 的第一份崩溃报告并正在尝试纠正该问题不幸的是它只包含一行在旧设备上运行的代码因此我无法在 iPhone 6 上测试它 Crashlytics 的崩溃报告突出显示了两个线程第一个内容如下 Fa
Singleton httpclient 与创建新的 httpclient 请求

我正在尝试使用 HttpClient 在我的网络服务中创建层Xamarin Forms移动应用没有单例模式具有单例模式 in first方法我在每个新请求中创建新的http客户端对象通过移动应用程序这是我的代码 public Htt
macOS 11 Big Sur 中具有自定义视图的 NSMenuItem

macOS 11 Big Sur 当前版本 beta 1 到 beta 6 有一个错误功能使得 NSMenuItem 难以使用自定义视图具体来说当菜单项突出显示时项目的自定义视图不会调用draw dirtyRect 我通过 NSM
读取并绑定多个 csv 文件

我有一系列 csv 文件每个文件一个具有相同的列标题和不同的行数最初我是这样读入并合并它们的 setwd lt N Ring data by cruise Shetland LengthHeight2013 lt read csv N
jsp中的“页面范围”是什么？

有以下范围JSP 页面范围请求范围会话范围适用范围我对页面范围感到困惑谁能告诉我这是什么页面范围我在任何地方都没有找到它的明确定义 page范围意味着它可以被认为是代表整个JSP页面的对象即JSP 对象只能从创建它的同一页面
在 Eclipse 中添加库 v7 AppCompat 时如何解决错误“未找到与给定名称匹配的资源”？

我的项目目标是 API 级别 10 我想实现新的 ActionBar 支持库按照中的所有说明进行操作后支持库设置 http developer android com tools support library setup html 当将
file.choose() 在 Windows 上打开没有文件名的对话框

当我使用file choose or choose files选择文件时对话窗口会显示文件夹图标但不显示文本以前没有出现过这个问题我不久前更新了 RStudio 但我不确定这是否是原因我目前使用 R 4 1 1 和 RStudio
CertPathValidatorException：找不到证书路径的信任锚 - Retrofit Android

我正在创建一个 Android 应用程序它使用https用于与服务器通信我在用retrofit and OkHttp用于提出请求这些对于标准来说效果很好http要求以下是我遵循的步骤 Step 1 使用命令从服务器获取证书文件 ec
计算彩色图像的 HSV 直方图与 H-S 直方图有何不同？

我想计算图像的 HSV 直方图我搜索了很多但没有发现任何有用的东西在opencv在线指南中我找到了H S直方图 V 对光照有什么影响 HSV 和 H S 是否相同意味着 V 对光照没有影响这是H S直方图的代码 cvtColor
将简单的 Antlr 语法转换为 Xtext

我想将一个非常简单的Antlr语法转换为Xtext 所以没有句法谓词 https stackoverflow com questions 5728659 translate antlr grammar into xtext grammar
mathematica 如何确定在替换中首先使用哪个规则

我想知道如果给定多个替换规则 mma 如何确定在发生碰撞时首先应用哪个规则一个例子是 x 3 x 2 s x 3 s 2 s x x gt 0 x OddQ gt 2 Thanks Mathematica 有一种机制能够在简单情况下确定规
从问题到 Wiki 的 GitHub 链接

我想要链接维基页面来发布文本语法链接到问题池中 text page 不起作用怎么做您还可以使用相对路径这是我的一个项目的示例 Using a Shell Configuration File wikis Using a Shell
mySQL 分区多文件与单文件性能对比？

对大型表进行分区时我可以选择将标志 innodb file per table 设置为 TRUE 或 FALSE True 将创建许多文件每个分区一个并大大增加我的磁盘使用量但允许我将分区分布在不同的卷上我不打算这样做 FALSE
区分手指触摸和手/掌托

Is there any technique to differentiate between finger touch and palm rest on surface while drawing on touch surface in
F#：可以在运行时动态绑定度量单位吗？

我对 F 非常陌生对测量单位功能很感兴趣并且大致了解它的正常工作原理但想知道是否可以将测量值绑定到我们不知道测量值的值直到代码执行我正在查看的实际示例是将浮点数绑定为货币值其中度量单位是从数据库查找中推断出来的假设每种货币美元
这个视图控制器是否在“willSet/didSet”对中泄漏？

你有一个 vc 绿色它有一个面板黄色支架假设您有十个不同的视图控制器价格销售库存卡车司机调色板您将一次将它们放入黄色区域它将动态加载故事板中的每个 VC instantiateViewController withI
开放 NLP 名称查找器培训

我正在根据在线手册 http opennlp apache org documentation 1 5 2 incubating manual opennlp html 构建一个名为 en ner person train 的 15k 行训

开放 NLP 名称查找器培训

开放 NLP 名称查找器培训 的相关文章

随机推荐

热门标签

开放 NLP 名称查找器培训的相关文章