不断发展中的自然语言处理技术,会在未来消灭“笔”和“键盘”吗?

2023-10-26

花满楼 发布于2014-07-20 23:11:00

目前,Siri 和 Google Now 的语音识别技术虽然还不完善,但在未来却很可能威胁到文字的地位。我们手写或者打字,在当下已经成为了无比繁重的劳动,不断的输入各种文字信息,在网页上搜索各种关键词,让我们的手腕发酸,手指发颤。

在 iOS 操作系统上运行的数字设备,现在已经可以识别语音信息,未来还会出现“无人驾驶汽车”,语音激活的房门,灯光和电梯,很明显未来是一个“说”的时代,而非“写”的时代。在“我们如何与周遭环境进行互动?”这个课题之下,所隐藏的技术就是自然语言处理。这项技术能够让计算机识别我们的话语,并且还能辨认出我们的用语习惯。除了 Siri 和 Google Now 之外,你也许还在 Xbox One 和 Samsung UE65HU8500 (一款高清电视) 上面体验过这项技术。

自然语言处理技术的瓶颈是什么?

但是至今,语音识别技术只是针对少部分的短语和词汇进行识别。如果对象是我们平日里的对话,这项技术还远没有胜任辨识的工作。在 Rovi 的全球战略部门担任董事的查理斯·多斯(Charles Dawes)表示:“现在的技术还是依靠结构化的菜单系统,在这个系统中,有指定的语音来替代常规情况下人们愿意输入的字词。这样才能方便系统识别。但是这样一来,并不能满足人们的根本性需要。人们不得不在面对一款机器时,思考如何跟它对话,这样一来,说出来的话就是僵硬的,而不是自然而然的了。”

一旦涉及到语音识别,其关键就是对内容的解读,并且要对一般性的短语和词汇进行纵深性的解读。举个例子,一个电视观众说道:“本城市在今晚的比赛是几点的?”那么语音识别技术就必须能够结合说出这句话的情境是怎样的,即这位电视观众是想看足球。是否识别出来,取决于对用户长期以来搜索信息的偏好,使用数码设备的种种习惯,甚至了解他们是支持诺维奇城足球俱乐部,还是支持曼城足球俱乐部?同时,这项技术还得去适应突发性的转变。如果还是那名观众,突然又说道“今晚有什么好看的恐怖片?”的时候,系统必须能够跳出刚才涉及足球的语境。

制造语音转换文本软件的公司 Nuance Communications 的英国,中东区域销售经理乔森·怀特莫(Jonathan Whitmore)表示:“人际交流中最自然的方式就是对话。这给了人与各种数码设备(从手机到电视)之间互动的可能。声音对于每个人来说,都是独一无二的,这也能成为确定个人身份的安全方式。还有,对着手机说话,当然比打字要轻松许多。”但是,开发一个具有自然语言处理技术的网站和 app ,要求它们必须是反应灵敏,有求必应的,这就是非常复杂困难的一件事。怀特莫对此说道:“这牵扯语义学,语言学。对话内容,人群搜索信息方式,以及不同数据之间关系构建等诸多难题。”

自然语言处理技术所应用的领域是什么?

在电视上所应用的自然语言识别系统,至今依赖于其内置的话筒。但是大多数人现在已转向 app 应用了。多斯先生相信,智能手机和平板电脑的广泛普及,让用户有机会在他们的“第二块屏幕”上,搜索电视节目,和获得推荐的电视节目。除此之外,我们能看到还有很多地方都应用着自然语言处理技术。Barclays Wealth 用它来辨认账户所有人,airline JetBlue 正在使用智能语音广告技术,并且 Ford 正在为司机们开发自然语言识别技术,使得他们能够控制车内的电子设备,比如手机,音响,温度调节器,导航以及交通状况播报。

一个由声音主宰的未来也许在远方等着我们,但是就目前而言,我们还在埋头忙乱的敲打键盘。Nuance 公司目前就希望利用它的 Dragon 数字听写软件,桌面语言识别软件改变这一现状。比如超赞的 Dragon Dictation 4 以及免费的 Dragon Recordr App。后者这款产品现在能让前者转录声音,这对于移动工作者来说,无疑是个福利。

自然语言处理技术能够消灭犯罪吗?

看起来是很有可能的。由多名美国语言学家参与创建的 Fonetic 公司,就是通过分析一段对话,辨识出来是否存在虚假交易金融欺诈等恶性事件。Fonetic 已经花了 5 年时间,创建了涉及 79 种语言的金融业专业词汇组。Fonetic US 的 CEO 西蒙·理查德兹(Simon Richards) 表示:“金融欺诈很有可能是金融编程上做手脚,也有可能是诸如内幕交易的市场性行为。这些都是非常难以侦查出来的违法犯罪行为。而现在这项技术能在人工智能的架构下,将零散的一段语言,比如平日里的一通电话,进行分析。更关键是将谈话内容归纳到某个类别之下。软件能够辨别什么是符合情理的,什么是比较奇怪的。这样就能有效的遏制和侦查出来金融领域的违法犯罪行为。”

在未来,是不是一切都要使用自然语言处理技术?

短期来看不太可能。自然语言处理技术现在已经用在 Siri 和 Google Now 上,同时也会应用在微软的 Cortana 上,但它同时还是一个非常前沿的技术。智能手机的开发还不是围绕它来进行。语音涉及了一系列人工智能方面的技术应用,来去了解人们说话的动机,和当时的语境。这是非常具有挑战的环节。但如果一旦突破瓶颈,真正具有完善的自然语言处理技术的智能手机和平板电脑,将催生出一代人,他们将再也受不了家里面那些“蠢笨”的电子科技产品了。

来源:TechRadar

原文地址:http://tech2ipo.com/78008

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

不断发展中的自然语言处理技术,会在未来消灭“笔”和“键盘”吗? 的相关文章

随机推荐

  • 机器人教育是一种科学的探究方式

    创新是推动经济社会发展的核心驱动力 当前 我国已经深刻认识到世界新科技革命带来的机遇和挑战 以高度的历史责任感 强烈的忧患意识和宽广的世界眼光 把创新作为推动经济社会发展的驱动力量 机器人技术的进步将会对科学与技术的发展产生重要影响 只有开
  • 算法(C)(两数之和)

    题目 两数之和 题目描述 给定一个整数数组 nums 和一个整数目标值 target 请你在该数组中找出 和为目标值 target 的那 两个 整数 并返回它们的数组下标 你可以假设每种输入只会对应一个答案 但是 数组中同一个元素在答案里不
  • JSON使用的一些总结

    http sx666 blogspot com 2007 11 json html JSON JavaScript Object Notation 是一种轻量级的数据交换格式 它采用完全独立于语言的文本格式 可以用来在客户端和服务器端传输数
  • innerText和innerHTML区别

    innerText和innerHTML区别 尽管DOM带来了动态修改文档的能力 但对开发人员来说 这还不够 IE4 0为所有的元素引入了两个特性 以更方便的进行文档操作 这两个特性是innerText和innerHTML 其中innerTe
  • Oracle:重复数据去重,只取其中一条(最新时间/其他字段排序规则)数据

    一 问题 一个会话id代表一个聊天室 返回该聊天室最新的一条数据显示在会话列表 二 解决思路 使用row number over 分组排序功能 来解决该问题 1 语法格式 row number over partition by 分组列 o
  • TMOD、SCON、PCON寄存器的配置

    TMOD控制寄存器 TMOD是定时器 计数器模式控制寄存器 它是一个逐位定义的8为寄存器 但只能使用字节寻址 其各位是 由上图我们就可以看出 这个寄存器控制了两个定时器 计数器 寄存器的高四位控制定时器1 低四位控制定时器0 GATE 门控
  • 数据分析毕业设计 二手房数据爬取与分析可视化系统 -python

    1 前言 这两年开始毕业设计和毕业答辩的要求和难度不断提升 传统的毕设题目缺少创新和亮点 往往达不到毕业答辩的要求 这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求 为了大家能够顺利以及最少的精力通过毕设 学长分享优质毕业设计项
  • Air700E开发板

    文章目录 基础资料 概述 主要功能 外设分布 PinOut 管脚定义 管脚功能说明 固件升级 正常开机模式 下载模式 IO 电平选择 基础资料 Air700E文档中心 概述 EVB Air700E 开发板是合宙通信推出的基于 Air700E
  • 去除VsCode代码前面的小点点

    去除VsCode代码前面的小点点 去除图片中的点 步骤 File gt Preferences gt Setting 搜索RenderWhitespace 将Text Editor下的Editor Render Whitespace改为no
  • peewee-async使用描述

    1 peewee async是一个为peewee ORM 提供由asyncio支持的异步io库 在单独使用peewee连接池连接时 同时使用到了async和await协程 这样操作会阻塞整个进程 因为tornado是单进程 必须数据库也使用
  • 数据库的简介与类型 #CSDN博文精选# #IT技术# #数据库#

    大家好 小C将继续与你们见面 带来精选的CSDN博文 又到周一啦 上周的系统化学习专栏已经结束 我们总共一起学习了20篇文章 这周将开启全新专栏 放假不停学 全栈工程师养成记 在这里 你将收获 将系统化学习理论运用于实践 系统学习IT技术
  • 高通 AR Unity 虚拟按钮

    1 虚拟按钮是图像上的目标 用户可以在现实世界中触摸 以触发一个动作的 热点 现有的图像目标的一个实例的VirtualButton预制拖动到场景中添加虚拟按键 平移和缩放按钮 以匹配所需的位置 并给它一个名字 虚拟的按钮添加这样写入到con
  • 计算机视觉概述

    关注公众号 CV算法恩仇录 本文介绍了计算机视觉的主要任务及应用 全文大约 3500 字 阅读时间 10 分钟 人们或许没有意识到自己的视觉系统是如此的强大 婴儿在出生几个小时后能识别出母亲的容貌 在大雾的天气 学生看见朦胧的身体形态 能辨
  • v-viewer 插件图片点击放大预览的几种使用方法

    官网git地址 https github com mirari v viewer 最终效果如下 ps 按钮样式都是可以根据自己需求调整的 第一种使用方法 支持UMD用法 建议把v viewer相关的js和css文件下载到本地引用 可以到上面
  • set容器、map容器

    set multiset 容器 set基本概念 简介 所有元素都会在插入时自动被排序 本质 set multiset属于关联式容器 底层结构是用二叉树实现 set和multiset区别 set不允许容器中有重复的元素 multiset允许容
  • elk笔记23--定期清理索引

    elk笔记23 定期清理索引 1 介绍 2 方案 代码 2 1 方案介绍 2 2 代码 2 3 测试 3 注意事项 4 说明 1 介绍 在生产环境中 如果日志量过大 就会导致集群持续产生很多索引 占用很多存储空间 因此需要定期清理索引 确保
  • 套圈·分治

    套圈 题目信息 输入 测试样例 解答 想法 题目信息 Have you ever played quoit in a playground Quoit is a game in which flat rings are pitched at
  • 闭环步进与伺服电机差异

    当给步进电机配备编码器闭环控制后 从广义上来看 闭环步进电机和伺服电机两者是没有什么大的区别 但是 要详细区分闭环步进电机和伺服电机的不同之处 你需要先了解一下伺服电机和步进电机的差异 闭环步进电机是在步进电机上加装了高精度的编码器 用伺服
  • 理解扩散模型:Diffusion Models & DDPM

    引言 在前面的博客中 我们讨论了生成模型VAE和GAN 近年来 新的生成模型 扩散模型受到越来越多的关注 因此值得好好去研究一番 扩散模型 Diffusion Models 最早由 2 于2015年提出 但直到2020年论文 3 发表之后才
  • 不断发展中的自然语言处理技术,会在未来消灭“笔”和“键盘”吗?

    花满楼 发布于2014 07 20 23 11 00 目前 Siri 和 Google Now 的语音识别技术虽然还不完善 但在未来却很可能威胁到文字的地位 我们手写或者打字 在当下已经成为了无比繁重的劳动 不断的输入各种文字信息 在网页上