从完整的句子自动生成意图和实体

2023-12-26

我正在构建一个机器人Rasa.ai http://www.rasa.ai当使用 Rasa NLU 训练机器人时,我们使用指定文本、意图、实体等的训练数据文件。例如,对于一个简单的餐厅聊天机器人,训练文件data.json可能含有

{
        "text": "central indian restaurant",
        "intent": "restaurant_search",
        "entities": [
          {
            "start": 0,
            "end": 7,
            "value": "central",
            "entity": "location"
          },
          {
            "start": 8,
            "end": 14,
            "value": "indian",
            "entity": "cuisine"
          }
        ]
      }

我们用它来训练模型。但我们需要手动(或通过 GUI)创建这个训练文件。

有没有什么工具可以让我输入句子并且它可以自动创建意图和实体?

Sample Input: Is there any central Indian restaurant?
Sample Output: The above data.json

EDIT:

为了更好地解释这个问题 - 假设我有大量的客户服务通话记录。我的理解是Rasa(或其他类似的框架) - 人类需要浏览呼叫日志并了解所有可能的意图、过去发生的实体组合并创建一个像data.json在训练模型之前如上所示。这似乎是一个真正无法扩展的问题。有没有办法生成它data.json无需人工参与即可从这些 GB 大小的通话日志中提取文件?我在这里错过了什么吗?


这正是您训练 Rasa NLU 执行的任务。接收句子并将其转化为结构化输出。通过提供示例,您可以向模型教授其工作原理。

因此,您不必为千兆字节的客户日志提供注释,而只需提供一些注释,并且算法应该推广到尚未见过的其他句子。它的效果如何取决于你有多少意图、它们的复杂程度以及其他因素。

我会首先注释几百个句子(降价格式 http://nlu.rasa.com/dataformat.html#markdown-format实际上更容易一些),将 50 个左右的示例分开,然后看看 Rasa NLU 预测它们的效果如何。继续注释越来越多的示例并将它们添加到您的训练数据中,直到您对保留示例的性能感到满意。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从完整的句子自动生成意图和实体 的相关文章

随机推荐

  • boto3 从客户端获取资源

    适用于 python 的 AWS 库 boto 有两种不同类型的接口用于与 AWS 配合使用 一种是低级接口client更高层次的Pythonicresource 我的代码的一部分使用其中之一 而其他部分则使用另一个 得到一个client
  • C 和 C++:数组元素访问指针与 int

    如果您这样做 会有性能差异吗myarray i 或存储地址myarray i 在指针中 Edit 这些指针都是在我的程序中的一个不重要的步骤中计算的 其中性能不是标准 在关键部分 指针保持静态并且不被修改 现在的问题是这些静态指针是否比使用
  • 为什么切片线程对使用 ffmpeg x264 的实时编码影响如此之大?

    我正在使用 ffmpeg libx264 对从 x11 实时捕获的 720p 屏幕进行编码 帧速率为 30 当我使用 调整零延迟参数下 每帧的平均编码时间可高达 12ms 使用配置文件基线 经过研究ffmpeg x264源代码 我发现导致这
  • 在 D2 中将 std.algorithm.map 与成员函数结合使用

    I have Foo foo new Foo foreach i 0 10 Bar bar foo getBar i 我希望能够 等效地 说 foreach bar foo getAllBars 我该如何实施getAllBars 我想了这样
  • Google Cloud 服务是否支持嵌套虚拟机?

    我正在尝试配置一个应用程序以在 Google Cloud 上运行 我能够启动运行 Windows 2008 Server 64 位 的 VM 并在其中安装 VMWare Player 然后我尝试在 VMWare Player 中安装并启动第
  • 如果 pandas 数据框超过 10 行,则将其分成两部分

    我有一个巨大的 CSV 文件 其中有很多表和很多行 如果每个数据帧包含超过 10 行 我想简单地将其分成 2 个 如果为 true 我希望第一个数据帧包含前 10 个数据帧 其余数据帧包含在第二个数据帧中 有没有一个方便的功能 我环顾四周
  • 如何在导航架构组件中实现条件导航

    在新的Navigation架构组件中 如何实现条件导航 目前我有一个包含 LoginFragment 和 HomeFragment 的活动 基于某个 login flag 我曾经从 MainActivity 中调用任一片段 由于 Login
  • 升级到Spring Security 4.0.0后出现403错误

    我一直在尝试将我的项目更新到 Spring Security 4 0 0 我想我已经读过迁移指南 http docs spring io spring security site migrate current 3 to 4 html5 m
  • 卡在从非托管 C++ 调用托管 CLI 方法的调用约定上

    我正在尝试从非托管代码调用托管方法 但是 托管代码要求我使用 clrcall 调用约定 而我的非托管 C 代码拒绝让我在不使用 clr 选项的情况下使用 clrcall 调用约定 我不认为我想这样做 因为非托管项目不是我可以更改为托管的 正
  • 如何在 git rebase 期间通过哈希识别冲突的提交?

    当我遇到合并冲突时使用git rebase 如何确定冲突的根源就提交而言 而不仅仅是文件差异 我已经知道如何 基本 使用git mergetool or git add before git rebase continue 但有时文件之间的
  • 梯度下降算法不会收敛

    我正在尝试为斯坦福机器学习讲座中解释的梯度下降算法编写一些代码 第二讲 25 00左右 http www youtube com watch v 5u4G23 OohI t 25m 下面是我最初使用的实现 我认为它是从讲座中正确复制的 但是
  • 类型错误:对象原型只能是对象或 null:未定义

    如果我导入如下Entity我收到帖子的主题错误 TypeError 对象原型可能只是一个对象或 null 未定义 但是如果我将导入替换为实际的Entity声明代码运行良好 Stackblitz 演示在这里 https stackblitz
  • Android 应用程序内存中 SQLite 数据库的最大大小?

    我的 Android 应用程序的数据库可以有多大 有限制吗 出于性能和安全原因 我不想将数据库存储在 SD 卡上 就阅读内容而言 除了正常限制之外 内部存储上的 sqlite db 大小没有硬性限制 即 什么是多余的 然而 有些人报告较大数
  • 需要故事板帮助来模仿 iPhone 翻转专辑封面的方式

    尝试模仿 iPhone 将专辑封面翻转到歌曲列表的方式 我想传递两个通用对象并让故事板翻转它们 我可以获得幻灯片效果 但还没有弄清楚如何缩放对象 使其看起来在旋转而不仅仅是滑动 Thanks Dave 在 XAML 中完成此操作比使用现有组
  • MVC如何忽略嵌套视图模型的验证

    我有一个页面 我将两个视图模型发布到控制器 查询和预约 预约嵌套在查询中 用户可以选择向我们提交查询 而无需创建预约 我在视图模型属性上使用内置的 MVC 所需属性 我的问题是 当用户选择创建没有预约的查询时 如何优雅地忽略嵌套 Appoi
  • phoenix中如何实现用户认证

    我正在 phoenix 创建一个 web 应用程序 我想知道什么是更好的方法来实现用户注册 身份验证和会话管理 在谷歌上我找到了这两个库 addict https github com trenpixster addict and pass
  • Protractor - 如何选择重度嵌套的下拉元素?

    我正在测试的网站有一个下拉菜单 其中包含以下代码 ul class nav navbar nav navbar right li class dropdown a href class dropdown toggle span class
  • 使用 xarray 对非标准 CFTimeIndex 日历(360 天,无闰年)重新采样以供 pandas 使用的方法

    60198708 https stackoverflow com questions 60198708 xarray cftimeindex to datetimeindex out of bounds nanosecond timesta
  • 在您的证书中找不到 iPhone 开发者/发行版身份 错误

    我使用 PhoneGap Build 制作了 IOS 应用程序 其工作正常 但现在我想添加 APNS 通知 因为我从 Mac 制作了 iPhone 开发人员证书用于推送通知和 p12 文件 配置文件 我按照提到的所有步骤进行操作Here h
  • 从完整的句子自动生成意图和实体

    我正在构建一个机器人Rasa ai http www rasa ai当使用 Rasa NLU 训练机器人时 我们使用指定文本 意图 实体等的训练数据文件 例如 对于一个简单的餐厅聊天机器人 训练文件data json可能含有 text ce