文本意图识别方案整理

2023-11-09

意图识别本质上是文本分类问题,从目前的对话数据来看,用户说的话一般是短文本,长度大多在几十个字内,其中关键词和短语对分类显著的作用。

目前主流的本文分类模型可以分为CNN、RNN和Bert(self-attention)三类,三者可以结合起来,同时由于短本文中关键词对分类结果作用明显,添加attention机制也是常用的trick。

1、基于CNN的意图识别

CNN的作用是用来提取文本的特征(可以看作是n-gram特征),根据特征进行分类,由于CNN提取的n-gram特征能突出关键词的作用,相比于RNN效果可能更佳。

 

论文:Convolutional Neural Networks for Sentence Classification

代码:https://github.com/NLPxiaoxu/Easy_TextCnn_Rnn/tree/master/TextCnn

2、基于RNN的意图识别

RNN网络在文本分类中,作用是用来提取句子的关键语义信息,根据提取的语义对文本进行区分。

普通的LSTM模型用于文本分类:

 

论文:Recurrent Neural Network for Text Classification with Multi-Task Learning

代码:https://github.com/NLPxiaoxu/Easy_TextCnn_Rnn/tree/master/TextRnn

带attention机制的文本分类模型:

 

论文:Hierarchical Attention Networks for Document Classification

代码:https://github.com/richliao/textClassifier

3、CNN和RNN结合

 

论文:Recurrent Convolutional Neural Networks for Text Classification

代码:GitHub - roomylee/rcnn-text-classification: Tensorflow Implementation of "Recurrent Convolutional Neural Network for Text Classification" (AAAI 2015)

4、基于Bert的意图识别

bert模型由于其体量大,参数多,对时效性要求比较高的系统友好性不够,如果采用bert模型,需要做一些知识蒸馏或者采用ALbert等。

 论文:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

代码:https://github.com/google-research/bert

5、业界方案整理

腾讯游戏智能客服意图识别

贝壳找房基于ALbert的意图识别

阿里小蜜意图识别

小米对话系统意图识别

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

文本意图识别方案整理 的相关文章

随机推荐

  • matlab如何实现不同的值显示不同的颜色

    举例一 一 视图 二 代码 作者 CoderMan 链接 https www zhihu com question 503639152 answer 2257427351 来源 知乎 著作权归作者所有 商业转载请联系作者获得授权 非商业转载
  • 二进制算法_本地二进制模式算法:其背后的数学❗️

    二进制算法 介绍 Introduction The main idea behind LBP is to describe the neighborhood of image elements using binary codes This
  • C++全局变量的初始化过程

    全局变量在main 前完成初始化 调用构造函数 在调用构造函数前 全局变量已分配空间 内存全0 多个全局变量的初始化 按照代码编译的顺序 注意 全局变量被访问前可能它还没有调用构造函数初始化 如果一个项目中 多个dll都用到一个全局变量在共
  • 开发过程中数据库使用反引号

    开发遇到的反引号 不使用会报错 反引号是为了区分MySQL的保留字与普通字符而引入的符号 index insert into sys menu menu name pid index url values 章节测测 2 kk
  • ajax无刷新登陆原理,基于Ajax技术实现无刷新用户登录功能

    感兴趣的小伙伴 下面一起跟随编程之家 jb51 cc的小编两巴掌来看看吧 代码如下 JScript 文件 function userslogon var userName document getElementById txtuserNam
  • 若依代码生成自带导入功能

    文章目录 1 修改ruoyi generator下resources下vm java controller 2 修改ruoyi generator下resources下vm java service 3 修改ruoyi generator下
  • x 的平方根

    给你一个非负整数 x 计算并返回 x 的 算术平方根 由于返回类型是整数 结果只保留 整数部分 小数部分将被 舍去 注意 不允许使用任何内置指数函数和算符 例如 pow x 0 5 或者 x 0 5 示例 1 输入 x 4 输出 2 示例
  • 【vue】渲染大量数据时性能优化

    对应vue渲染大量数据时可以考虑下面几点 1 异步渲染组件 因为组件渲染太多 影响页面的渲染时间 所有可以延迟组件渲染 可以考虑v if处理 2 可以使用虚拟滚动的组件 参考使用这个插件 vue virtual scroller 地址 ht
  • vue+element后台管理系统+TagsView基础版

    TagsView基础版 1 使用框架 插件 vue2 element vuex 2 大概思路 大概需求 1 从效果图看 人类 这个首页的tag一开始就存在 且不能被删除 2 当点击左侧栏的时候 如果没有与该菜单相应的tag则新增 如果存在
  • 关于“代码分层”的思考

    在很多语言中 都会利用 目录 来规范开发者分层的逻辑 比如Javaweb中 会将目录分为Controller Service Dao Model等等 利用目录的形式对开发者进行约束 能够使代码整体结构更加清晰 功能分工更加明确 我一直 以为
  • java中的TreeMap

    TreeMap集合 package dailyTest import javax persistence criteria CriteriaBuilder import java util StringJoiner import java
  • 弱网测试(Charles模拟)

    一 介绍 移动应用的网络环境多样 而且会出现在不同网络之间切换的场景 即使是在同一网络环境下 也会出现网络连接状态时好时坏的情况 比如时高时低的延迟 经常丢包 频繁断线 在乘坐地铁 穿越隧道 和地下车库的场景下经常会发生 所以 移动应用的测
  • 理解一个最简单的C语言代码,“hello world!“的真相

    怎么编写出一个最简单 能运行的程序 int main 使用你习惯的编辑器 创建test cpp 把这些代码敲进去 这就是一个程序了 他可以编译成一个test exe 是一个可以执行的程序 只不过这个程序什么事情都没做 可以暂时不用理解为什么
  • ue4 材质始终面向摄像机

    材质面向设想
  • flutter 基本类写法

    import package flutter cupertino dart class text extends StatefulWidget 有状态的 override State
  • ubuntu添加qmake 出现错误 qmake: could not exec '/usr/lib/x86_64-linux-gnu/qt4/bin/qmake': No such file or

    出错原因 没有安装qt4库 usr lib x86 64 linux gnu qt4 所以出现错误 可以安装手动安装qt库 sudo apt get install qt sdk 如果自己编译 库 那就需要手动修改路径 cd usr lib
  • VUE+Element-ui实战之el-calendar日历自定义显示内容

    目录 1 确保添加el calendar组件 2 遍历日期 确定显示内容 3 最终实现效果 4 完整代码 1 确保添加el calendar组件 确保你的element引入了el calendar组件 这里不再赘述 2 遍历日期 确定显示内
  • DLP和DMD的区别

    DLP是解决问题的方案 DMD是上述方案内采用的芯片 DMD只是DLP的一部分 DLP技术是TI的专利 全球只有TI提供 而采用DLP方案就必须用到DMD芯片 这也是TI垄断的
  • git如何撤销所有本地修改

    git checkout 本地所有修改的 没有的提交的 都返回到原来的状态 git stash 把所有没有提交的修改暂存到stash里面 可用git stash pop恢复 git reset hard HASH 返回到某个节点 不保留修改
  • 文本意图识别方案整理

    意图识别本质上是文本分类问题 从目前的对话数据来看 用户说的话一般是短文本 长度大多在几十个字内 其中关键词和短语对分类显著的作用 目前主流的本文分类模型可以分为CNN RNN和Bert self attention 三类 三者可以结合起来