谈一谈关于NLP的落地场景和商业价值

2023-11-17

欢迎大家关注微信公众号:baihuaML白话机器学习

在这里,我们一起分享AI的故事。

您可以在后台留言,关于机器学习、深度学习的问题,我们会选择其中的优质问题进行回答!

本期的问题:

你好,请问下nlp在现在的市场主要应用在哪些方面

什么是NLP?

答:利用机器学习技术来分析自然语言都属于NLP技术。(弱弱的说一句,NLP应该是语音、图像、文本这三种数据中,处理起来最难的数据!勿喷!)

什么是自然语言?

答:文本数据就是自然语言。语音数据并不是直接的自然语言,需要在经过语音识别之后,形成文本数据才能算作自然语言。

NLP的价值体现在什么地方?

答:大家想一想,我们是如何同这个世界进行交互的?比如:与人交流、浏览新闻,收集到的数据,我们需要进一步的加工获得语义上的信息,进而指导我们后续的行为。而NLP的价值,就体现在这个过程中:

  1. 如何更好的同机器沟通?
  2. 如何更快的理解我们收集到的数据?
  3. 如何同不同语言的人进行无障碍沟通?
  4. 如何发现一些杂乱无章内容中隐含的规律?
  5. 等等

实际上,自然语言充斥着我们社会中方方面面的。机器智能?没有算法的机器,是不能算作智能的。而智能则体现在理解能力上。NLP赋予机器智能,也就是带给机器理解语言的能力,机器就可以完成很多人能够操作的事情,这些都是NLP的落地场景和商业价值体现。

说了这么多的废话,那具体的落地场景有哪些呢?

  1. 聊天机器人/问答机器人/任务机器人

 

聊天机器人,之前火过一段时间,比如:人人网的“小黄鸡”、Siri、微软小冰等。不过随着时间的推移,热度消了很多,机器毕竟是机器,且智能化水平也没有那么高。越来越多的用户不会把时间浪费到跟机器人的互动上,因为根本不解决实际问题。

问答机器人,问答机器人不等于客服机器人,而是问答机器人>客服机器人,但是百度里搜问答机器人,得到的答案都是客服厂商,且好多人也同样认为问答模型目前在商业中的应用只是智能客服。但问答机器人的核心价值是,通过识别用户的文本含义,机器人回答对应问题。那这样看来,可不可以让机器人做行政助手、HR助手、IT运维助手、景区助手、物业管家等,这些场景下,都是用户通过一句话即可及时的得到自己想要得到的答案,用户体验当然会有提高。

任务机器人,任务机器人,也叫多轮对话机器人。那还是先提出一个概念,叫CUI(Conversation User Interface),反观人机交互历史,最早是CUI(Command User Interface),后面演化成GUI(Graphical User Interface),未来肯定必将是CUI了,动动嘴就形成了指令,计算机识别后就完成了任务,何乐而不为。所以未来的很多业务场景,完全是由人机的几轮交互,就完成了全部的订单流程。比如,订火车票、机票、电影票、银行卡/信用卡业务办理等,用户目前通过网站或APP等前端可以自助完成的操作均可以替代。任务机器人已经渗透到了商旅和金融,当然未来还会渗透到个多的行业,总结来看,任务机器人的商业价值是满分,当然也需要技术的不断升级。

——以上内容摘自《nlp如何进行商业化应用?

 

2. 机器翻译

如何能够实现更好的翻译,一直都是一个难题。现在有google翻译、百度翻译、有道翻译等等很多国内外NLP的团队都在做。它的重要性不言而喻。

  1. 垂直场景的需求-翻译机:从出国旅行,到国际文化交流,再到对外贸易,语言障碍是一个天然痛点,目前很多翻译类的产品将机器翻译和OCR技术以及语音识别技术进行结合,可以实时的通过摄像头来翻译外文指示牌、菜单、说明书等,也可以结合语音技术进行对话翻译,从而实现不同语种的无障碍交流。
  2. 语音同传技术:同声传译广泛应用于国际会议等多语言交流的场景,但是人工同传受限于记忆、听说速度、费用偏高等因素门槛较高,搜狗于去年推出的机器同传技术逐步开始在会议场景出现,演讲者的语音实时转成文本,并且进行同步翻译,低延迟显示翻译结果,希望能够取代人工同传,实现不同语言人们低成本的有效交流;
  3. 跨语言检索:中文资讯只占世界信息的10%,而跨语言检索需求逐年增加,搜狗于今年初推出的海外搜索将机器翻译和信息检索技术进行了结合,不论用户输入中文还是英文,系统都会从海量优质的英文网页中选出用户想要的搜索结果,并应用国际领先的机器翻译自动将其进行翻译,为用户提供英文原文、中文译文、中英双语三个页面的搜索结果;
  4. AI助力翻译行业升级:机器翻译和传统翻译行业相结合,利用机器翻译提升传统翻译行业的效率,提升商业价值。

 

——以上内容摘自《机器翻译有哪些商业化的应用场景?

 

3. 搜索引擎

NLP 是搜索引擎的技术之本

搜索引擎最基本的模式是自动化地聚合足够多的「内容」,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回。每一个环节,都需要用到自然语言处理。

  • 如何对网页内容进行核心知识抽取?比如:关键词、主题、自动文本摘要等
  • 如何对用户输入的句子进行分词
  • 如何从用户输入的信息中,找到用户的真实意图
  • 如何从用户的浏览历史中,对用户行为继续分析,挖掘用户的真实意图?
  • 如何计算两个不同页面之间的相似度?文本相似性
  • 等等

 

至于商业价值,看看百度就知道它的商业价值了。。

如果你不了解搜索引擎,可以看一下:KnowingAI知智:搜索引擎是如何工作的?| 知智一分钟

4. 舆情分析、情感分析

我们首先要明确一个舆情的概念,即表示的是公众态度和意见,里面主要涉及的是公众对社会生活各个方面的问题,尤其是一些热点问题的公开意见或者情绪部分。在言论自由的今天,互联网上充斥着各种各样的信息,有各种各样咨询、不同人的观点、海量的评论等。有了这些信息,我们能干什么事?作为普通大众中的一员,最好不要搞事情!舆情这东西,不是我等小虾米可以随便染指的。

但是,我们可以做一些其他的,政治不敏感的事情。比如:

  • 情感分析,可以用来分析用户对一些产品的喜好
  • 热搜内容/热门话题,可以用在今日头条这样的新闻类软件中
  • 观点抽取,可以帮助在分析某些问题的时候,提供更多的可参考的资料。

总之,从用户的角度分析,帮助我们对自己产品的监管。我们可以从许多消费者的评论知道,消费者最渴望我们提升哪一点,是提升产品,还是提升服务,还是加大促销力度。我们也可以知道,我们的竞品,哪一点是最薄弱的,是最为消费者诟病的。这一些情报,都是我们立足市场,做大规模的情报。

对于用户的评论,我们可以在第一时间收到,并且可以在统一平台一健回复消费者,无需在众多的平台切换帐号。这将大大提升我们处理问题的时效性,第一时间收集用户对我们品牌的反馈并进行回复,从而实现商机的挖掘。对于其中的任何一个差评,或有负面情感倾向的评论进行第一时间回复。 通过评论信息,我们可以知道消费者对我们产品,物流,售前还是售后等哪个纬度不满,还是对我们的市场营销策略有疑问,我们在收集这些情报以后,将可以更好地衡量或量化我们做出的每一个决策,从而提升我们的服务质量。

商业价值?产品大卖,用户口碑!这些都是符合我们利益的商业价值!

还有,就是公关危机!比如:人民网的舆情监测室根据突发事件的舆情生成和发展规律,提出了“黄金4小时媒体”之说,即在事发四小时内,利用微博、微信、BBS论坛、QQ群等新媒体传播平台,及时有效地发布信息,利用这些“黄金4小时媒体”进行危机公关。

 

5. 主题抽取、关键词抽取

关键词、主题能够帮助用户更快地认识到海量信息中的重点!挖掘用户的行为习惯和喜好,就能够更加精准的进行内容推荐、进行广告投放!!

广告====转化率=====就是money。

 

6. 阅读理解、文本分析与挖掘

计算机在结果逻辑处理问题时,可谓是得心应手,经验老道。但是在理解能力上,却一直都难以超越人类!提高机器的阅读理解能够,能够做什么?

  • 帮助我们更快的去处理海量的文字信息,比如:搜索引擎!
  • 帮助计算机能够更好的理解我们的意图,比如:人机对话!

 

阅读理解,是机器智能进度的再一次体现!

今天,好多关于机器做阅读理解的新闻,各大公司和研究团队纷纷报道取得世界冠军的头衔。

如何评价微软 AI 模型获人工智能阅读理解大赛第一名?

2018机器阅读理解技术竞赛,奇点机智获第一名 - AI科技大本营 - CSDN博客​blog.csdn.net图标

如何评价微软 AI 模型获人工智能阅读理解大赛第一名?

科大讯飞在世界级机器阅读理解测试中名列第一

平安斩获机器阅读竞赛世界冠军:欲戴王冠 必承其重

 

2018机器阅读理解技术竞赛,奇点机智获第一名 - AI科技大本营 - CSDN博客​blog.csdn.net图标

 

阿里人工智能连夺两项世界冠军,不仅会做阅读理解,还有这些用处

你们都很厉害。。。都是冠军。。

7. 推荐算法

推荐算法是一个很宽泛的内容,它包括了:用户意图、用户行为习惯分析、CRT问题等等。

用户的行为可以是:点击、评论、转发、收藏、消费、浏览时间、浏览时长等等。

用户的爱好可以从自己的点赞、收藏、购买等行为的角度出发,还可以从同类人的角度来看,也就是协同过滤(物以类聚、人以群分)等等。。当我们在互联网上留下痕迹的时候,我们就已经出卖自己了。关于推荐算法,可以了解下:

新社汇袁帅:今日头条推荐算法原理

谷文栋:Netflix推荐系统的最新解读:算法、商业价值与创新

推荐算法能干什么?

  • 分析用户、了解用户,改善用户体验、产品体验
  • 精准营销
  • 精准广告投放
  • 等等

 

研究推荐算法,一方面带给用户更多的便利,提高产品体验,另一方面就是帮助商家研究如何赚钱于无形之中。

 

关于NLP就聊这么多吧!

 

欢迎加入深度学习、机器学习技术研讨群!

745224003

欢迎关注我们的微信公众号:baihuaML,白话机器学习

关注知乎“会写代码的好厨师”

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

谈一谈关于NLP的落地场景和商业价值 的相关文章

  • 3W字长文总结PyTorch中常用的函数

    quad quad PyTorch基本函数更新 quad q
  • [深度学习] TensorFlow上实现Unet网络

    代码取自于 https github com jakeret tf unet TensorFlow Unet文档 https tf unet readthedocs io en latest installation html Tensor
  • 深度学习网络篇——VGGNet(Part1 网络结构&训练环节)

    我们上篇文章了解了一下NIN 接下来我们来了解一下VGGNet 可以说是另一波的跪舔和膜拜 VGGNet主要是分为两篇文章 第一篇文章来分享一下VGGNet的网络结构还有训练环节 第二篇文章是分享VGGNet做的分类实验和总结 此为第一篇
  • Pytorch中计算自己模型的FLOPs

    转自 Pytorch中计算自己模型的FLOPs thop profile 方法 yolov5s 网络模型参数量 计算量统计 墨理学AI CSDN博客 Pytorch 用thop计算pytorch模型的FLOPs 简书 安装thop pip
  • 朴素贝叶斯分类器简介及C++实现(性别分类)

    贝叶斯分类器是一种基于贝叶斯定理的简单概率分类器 在机器学习中 朴素贝叶斯分类器是一系列以假设特征之间强 朴素 独立下运用贝叶斯定理为基础的简单概率分类器 朴素贝叶斯是文本分类的一种热门 基准 方法 文本分类是以词频为特征判断文件所属类别或
  • 深度神经网络中的Inception模块介绍

    深度神经网络 Deep Neural Networks DNN 或深度卷积网络中的Inception模块是由Google的Christian Szegedy等人提出 包括Inception v1 Inception v2 Inception
  • 【pytorch】迁移学习

    在很多场合中 没有必要从头开始训练整个卷积网络 随机初始化参数 因为没有足够丰富的数据集 而且训练也是非常耗时 耗资源的过程 通常 采用pretrain a ConvNet的方式 然后用ConvNet作为初始化或特征提取器 有两种迁移学习
  • CrossEntropyloss function

    这里写目录标题 两部分 Part One 绕绕 可以不看 Part Two 清晰易懂 一定要看 两部分 Part One 绕绕 可以不看 Cross entropy loss function又称交叉熵损失 是基于one hot编码的 举个
  • window 7 平台上 MXNET 源码编译

    目的 本文主要描述怎么在windows上编译mxnet源码 得到可用的libmxnet dll和libmxnet lib文件 版本 mxnet x64 release CPU版 运行环境 windows 7 64bit visual stu
  • 05 两层神经网络 - 神经网络和深度学习 [Deep Learning Specialization系列]

    本文是Deep Learning Specialization系列课程的第1课 Neural Networks and Deep Learning 中Shallow Neural Network部分的学习笔记 在前面的章节中 我们以逻辑回归
  • 深度学习中的验证集和超参数简介

    大多数机器学习算法都有超参数 可以设置来控制算法行为 超参数的值不是通过学习算法本身学习出来的 尽管我们可以设计一个嵌套的学习过程 一个学习算法为另一个学习算法学出最优超参数 在多项式回归示例中 有一个超参数 多项式的次数 作为容量超参数
  • Pointpillars for object detection

    博客参考 pointpillars代码阅读 prep pointcloud篇 Little sky jty的博客 CSDN博客Brief这一篇内容主要是对函数prep pointcloud进行debug和记录 这里也是dataloader的
  • PyTorch训练简单的全连接神经网络:手写数字识别

    文章目录 pytorch 神经网络训练demo 输出结果 来源 pytorch 神经网络训练demo 数据集 MNIST 该数据集的内容是手写数字识别 其分为两部分 分别含有60000张训练图片和10000张测试图片 神经网络 全连接网络
  • GNN等优缺点总结及解决方案

    https www zhihu com question 338051122 https www zhihu com question 346942899 https zhuanlan zhihu com p 291230435 GCN的缺
  • Going Deeper with convolutions

    Going Deeper with convolutions 转载请注明 http blog csdn net stdcoutzyx article details 40759903 本篇论文是针对ImageNet2014的比赛 论文中的方
  • Pytorch Advanced(三) Neural Style Transfer

    神经风格迁移在之前的博客中已经用keras实现过了 比较复杂 keras版本 这里用pytorch重新实现一次 原理图如下 from future import division from torchvision import models
  • 损失函数和正则化

    参考 https www cnblogs com LXP Never p 10918704 html https blog csdn net Heitao5200 article details 83030465 https zhuanla
  • 谈一谈关于NLP的落地场景和商业价值

    欢迎大家关注微信公众号 baihuaML 白话机器学习 在这里 我们一起分享AI的故事 您可以在后台留言 关于机器学习 深度学习的问题 我们会选择其中的优质问题进行回答 本期的问题 你好 请问下nlp在现在的市场主要应用在哪些方面 什么是N
  • 深度学习中的优化算法之RMSProp

    之前在https blog csdn net fengbingchun article details 124766283 中介绍过深度学习中的优化算法AdaGrad 这里介绍下深度学习的另一种优化算法RMSProp RMSProp全称为R
  • 经典网络ResNet介绍

    经典网络ResNet Residual Networks 由Kaiming He等人于2015年提出 论文名为 Deep Residual Learning for Image Recognition 论文见 https arxiv org

随机推荐

  • GUI (图形界面)程序原理分析

    1 命令行应用程序 命令行应用程序的特点 是一种基于顺序执行结构的可执行程序 程序执行过程中不需要与用户产生交互 程序执行后给出最终的运行结果 gcc a c b c c c 编译过程中不产生用户交互 编译结束后或者生成可执行程序或者给出错
  • Visual Studio 2010——C#状态栏控件的使用

    实验环境 Windows XP Visual Studio 2010 Ultimate 1 创建项目 文件 gt gt 新建 gt gt 项目 选中 Windows窗体应用程序 如下图所示 2 点击菜单栏的 视图 依次找到 解决方案资源管理
  • MySQL中no action和restrict的区别

    在MySQL中 如果两个表存在主外关系 则有五种引用操作 分别是 cascade no action restrict set null和set default 有很多人对no action的restrict区别搞不清楚 其实在MySQL中
  • SQL使用技巧(3.1)递归层次查询Postgresql

    专题 SQL使用技巧 实践是检验SQL函数的唯一标准 场景描述 一 递归方法 WITH RECURSIVE 1 1创建表和数据 1 2构建递归查询 二 存储过程传参递归查询 三 帆软Report配置查询界面 3 1FineReport 连接
  • 【c程序】expected identifier before numeric constant错误

    在linux开发中 出现类似error expected identifier before numeric constant错误 原因 定义的enum结构体与其它处的宏定义有冲突 举例说明 在文件a h中 define TRUE 1 在文
  • 最新openCV-Python安装教程(opencv-python版本4.4.0, Python版本: 3.9)

    本文是最新的opencv python 安装教程 以前的一键安装 pip install opencv python 在新版本上并不能使用 本文会按照4步详细的介绍 opencv python 版本 4 4 0 Python 版本 3 9
  • 数据湖架构之Hudi编译篇

    前言 说起编译hudi 从第一遍过之后 再回过头来看 发现就是第一遍不熟悉 出现的一切问题可以总结为maven仓库没配置好 一开始我只是配置了阿里云仓库 但是后面不断报错 然后百度谷歌找原因 再调整配置 再编译 最后就成功了 所以整体来说编
  • jmeter-定时器

    目录 1 固定定时器 2 统一随机定时器 3 同步定时器 4 固定吞吐量定时器 一 定时器的使用目的 使用 定时器 的主要目的是模拟用户的 思考时间 在负载测试领域 思考时间 代表模拟真实用户行为 就是人们在与web应用程序的交互等待时间
  • QT 信号槽connect中解决自定义数据类型或数组作为函数参数的问题——QT qRegisterMetaType 注册MetaType——关键:注册自定义数据类型或QMap等容器类...

    一般情况下信号槽直接连接方式不会出现问题 但是如果信号与槽在不同线程或Qt QueuedConnection方式连接 可能会在连接期间报以下类似问题 如 QObject connect Cannot queue arguments of t
  • 微信小程序 嵌入页面的滚动选择器 picker-view picker-view-column 组件

    完整微信小程序 Java后端 技术贴目录清单页面 必看 嵌入页面的滚动选择器 其中只可放置 picker view column组件 其它节点不会显示 属性 类型 默认值 必填 说明 最低版本 value Array 否 数组中的数字依次表
  • 软工期末( 测试方法)

    白盒测试 白盒测试又称结构测试 透明盒测试 逻辑驱动测试或基于代码的测试 白盒测试是一种测试用例设计方法 盒子指的是被测试的软件 白盒指的是盒子是可视的 即清楚盒子内部的东西以及里面是如何运作的 白盒 法全面了解程序内部逻辑结构 对所有逻辑
  • C#常用的加密算法:MD5、Base64、SHA1、SHA256、HmacSHA256、DES、AES、RSA

    简介 本文主vb net教程要讲c 教程解一下C 常用的python基础教程那些加密java基础教程算法 包括MD5 Base64 SHA1 SHA256 HmacSHA256 DES AES RSA加密sql教程等 有需要的朋友可以参考下
  • Java写入txt文件内容

    Java写入数据进txt文件 需求 多条数据追加进文件 且需要处理中文编码问题 以下代码只能处理向文件添加数据的功能 但是会覆盖掉之前的数据 import java io File import java io FileOutputStre
  • 7-3 一维世界的纷争 (C++) 简单详细

    代码简单 难的点在于读懂题目 帝国A和帝国B统治着一维世界 帝国A的首都位于X 帝国B的首都位于Y 100 X
  • Linux中系统进程的详细管理

    一 什么是进程 进程就是系统未完成并且正在进行的工作 二 查看进程 1 图形方式查看 gnome system monitor 进程状态 R Running 该程序正在运行 S Sleep 改程序目前正在睡眠状态 idle 但可以被唤醒 s
  • VRTK4 入门指南

    VRTK4 说明文档 VRTK Farm Yard 示例 Virtual Reality Toolkit 要求使用 Unity 2020 3 24f1 Beta 免责声明 简介 入门 下载项目 在 Unity 中打开下载的项目 使用 Uni
  • Disruptor(一)Disruptor概念和RingBuffer数据结构

    Disruptor是LMAX公司开源的一个高效的内存无锁队列 谈到并发程序设计 有几个概念是避免不了的 1 锁 锁是用来做并发最简单的方式 当然其代价也是最高的 内核态的锁的时候需要操作系统进行一次上下文切换 等待锁的线程会被挂起直至锁释放
  • Unity 3D控制角色运动的方法

    一 transform Translate 方法 1 Input GetKey KeyCode 按键 if Input GetKey KeyCode W transform Translate Vector3 forward Time de
  • Ubuntu 18.04 16.04 设置输入法切换方法 中文输入法

    新装的unbunu 18 04 16 04 也可以 默认应该有中文输入法 但是应该不太好用 我们安装一个搜狗输入法 下面的shell代码实现了更新软件 检查语言支持 然后下载搜狗输入法 并且安装 然后把fcitx设置为默认输入 然后重启系统
  • 谈一谈关于NLP的落地场景和商业价值

    欢迎大家关注微信公众号 baihuaML 白话机器学习 在这里 我们一起分享AI的故事 您可以在后台留言 关于机器学习 深度学习的问题 我们会选择其中的优质问题进行回答 本期的问题 你好 请问下nlp在现在的市场主要应用在哪些方面 什么是N