我正在构建一个机器人Rasa.ai http://www.rasa.ai当使用 Rasa NLU 训练机器人时,我们使用指定文本、意图、实体等的训练数据文件。例如,对于一个简单的餐厅聊天机器人,训练文件data.json
可能含有
{
"text": "central indian restaurant",
"intent": "restaurant_search",
"entities": [
{
"start": 0,
"end": 7,
"value": "central",
"entity": "location"
},
{
"start": 8,
"end": 14,
"value": "indian",
"entity": "cuisine"
}
]
}
我们用它来训练模型。但我们需要手动(或通过 GUI)创建这个训练文件。
有没有什么工具可以让我输入句子并且它可以自动创建意图和实体?
Sample Input: Is there any central Indian restaurant?
Sample Output: The above data.json
EDIT:
为了更好地解释这个问题 - 假设我有大量的客户服务通话记录。我的理解是Rasa(或其他类似的框架) - 人类需要浏览呼叫日志并了解所有可能的意图、过去发生的实体组合并创建一个像data.json
在训练模型之前如上所示。这似乎是一个真正无法扩展的问题。有没有办法生成它data.json
无需人工参与即可从这些 GB 大小的通话日志中提取文件?我在这里错过了什么吗?