ChatGPT引发的人机交互发展历程与升级思考

2023-11-01

ChatGPT自从去年12月火爆以来一直热度不减,最近正好研读了科技之巅,书中详细阐述了人机交互、人工智能、算力算法等技术的发展历史,本文主要围绕ChatGPT引发的人机交互方面的思考。

在讨论人机交互之前,首先需要说明的一点,目前计算机发展的结果已经从原来作为科学计算工具转变为信息处理和信息交互工作,计算机通过软硬件帮助大家做业务研究或管理决策,目前大部分办公室白领、生产平台员工、智能工厂员工等从事的工作不是实际操作机器,而是要依赖一台计算机,甚至是一台能远程控制机器的计算机,计算机已经涉及人们的方方面面。

那么,人机交互是什么呢?人机交互是为了解决人类与机器(作为工具)之间的交流问题。人类和计算机的交流和互动是人机交互技术的核心,所有交互技术的发展都是用来提升人机交互的体验和效率。

人机交互从最初的穿孔卡片--》专用编程语言--》图形界面和鼠标操控--》Apple Siri/Google Assistant自然语言关键词交互--》ChatGPT自然语言理解交互--》Oculus Rift VR沉浸式虚拟现实--》Magic Leap Microsoft Hololens AR/MR增强/混合现实,使得人机交互更加符合人类自然的交互方式,从直观化和便捷化,发展到后来的可穿戴化,最后到达本能化和植入化。

应该说,ChatGPT彻底改变了以往我们使用计算机的应用入口,目前大家上互联网的入口主要还是搜索引擎,也有一些app,比如头条,小红书、b站等,但这些入口都有一个问题,主要还是通过关键词匹配内容,最多加入一些内容相关和个性化特征。但ChatGPT天生就是用大量语料训练的自然语言大模型,他解决了自然语言的分词、实体识别、关系识别、意图识别等等,而且ChatGPT是AIG的,即通用人工智能,解决大众普适的各类自然语言的问题,ChatGPT的受众更广泛,使用更自然,相比较以往的搜索引擎、语音助手、智能助手,ChatGPT更自然,正好是人机交互的发展所需,相当于是一种新的人机交互应用入口,大家称之为LUI(即Language User Interface),未来ChatGPT与各行各业的业务结合,一定会出现各种应用,比如ChatGPT+能源助手等。以下回顾了人机交互的发展历程。

1.结合手机的智能助手Apple Siri界面:Siri是2009年第一次出现在苹果手机,Siri不单单是一个搜索引擎,而是一个处理引擎,集成了AI、语音识别(与Nuance合作)、语音文字聊天服务和资源整合,人类通过与Siri大量的交流,Siri能够从交流中获取用户需求,并结合集成的各项技术和资源提供个性化答案。目前ChatGPT做到了更进一步,不单单是关键词,对整个语句进行了语义上下文理解,集合后端的大语言模型,提供有针对性的中性答案,人类也可以通过与ChatGPT互动,引导其提供某些倾向性的答案,相信后续的各种ChatGPT+业务应用场景会雨后春笋班的涌现出来。

2.手势界面:GUI界面需要键盘鼠标,触摸屏需要占用人类一两根手指,而手势界面是通过3D视觉识别技术实现的,核心是传感器和动作识别,所以,传感线和动作空间确定了手势界面的分层级别,平时玩游戏的游戏手柄相当于二维的触控手柄,而Microsoft Kinect体感游戏模块的动作识别就是三维空间的动作识别,Kinect通过深度摄像头,利用里面的红外线处理场景,获得物体景深信息并编码,再通过图像传感器读取编码后的场景,最后通过算法推算出场景的三维信息,非常复杂,要求高效,Kinect集成了动态捕捉、影像辨识、语音输入识别、多人互动等功能,应该是Kinect开启了人机交互的新纪元,但在三维空间中人机交互的动作识别和处理速度要求更高,XBOX就集成了Kinect,从而催生出手势界面和语音接口。

3.语音接口界面:语音接口其实是在AI、语音识别、自然语言处理和大语言模型技术催生下的产物,语音接口使得人机交互更加自然,计算机更贴心友好和个性化,而且受众用户也比图形用户界面广泛,比如老人、盲人,目前随着微信等即时通讯app的发展,语音接口已经成为人机交互的重要入口,特别是随着最近ChatGPT的火爆,后续一定会忘LUI方向发展,使得人机交互更加自然便捷。

4.智能可穿戴设备界面:目前大家每天用的最多的设备是手机,随着智能化可穿戴设备的出现,有可能有所转变,比如智能手表,智能手环,智能服饰,Google Glass眼镜,头盔等,这些设备或多或少具有语音识别、健康跟踪检测,健康指导指南、信息提醒等功能,我认为这些可穿戴设备都是一些过渡产品,未来可能会出现更加自然的人机融合产品。

5.沉浸式交互界面:VR是结合了众多人机交互接口技术的沉浸式超凡用户体验的核心技术,代表性产品是Oculus Rift VR;AR更进一步,是将虚拟事物加到现实世界中,代表性产品是Magic Leap或Microsoft Hololens,AR技术设计空间感知和光场显示技术,光场显示需要建立起四维的光场空间,使得虚拟物体与自然物体一样,在我们的视觉中有虚实变化,高低远近物体的聚焦变化等。这两项技术目前只在一些固定场景或游戏场景里面使用,针对消费类或工业类应用场景,实现通用的技术难度还是比较大,需要结合数字孪生,渲染引擎来做,目前在硬件、软件、产品定位和实际应用场景方面都存在大量未攻克的瓶颈,目前还做不到人类要求的自然人机交互水平,但后续的发展机会也非常多,现在国内外已经有很多结合头盔方面的产品和应用案例,因为我们实际业务中都得带头盔,相当于头盔是人从事工业工作得必需品,而这种设备相当于在头盔外面加一个附加设备。

因此,过去10年,人机交互技术发生了翻天覆地的变革,从最早的CLI(Command Line Interface)-->GUI(Graphical User Interface)-->VUI(Voice User Interface)-->LUI(Language User Interface),人机交互演进从直观化--》便捷化和集成化--》可穿戴化--》本能化和植入化

目前从人类五官(听觉、视觉、触觉、嗅觉和味觉)来分析,其实除了后面两个外,其他都已被人机交互技术涵盖了,只是精细度、自然性和一致性未达到人类要求,人机交互已经从一维/二维发展到三维或多维立体,也就是说,未来应该从感官层面向着脑意识层面转变,比如通过隐形眼镜、脑机接口真正实现人机融合,未来的人机交互技术或产品更加集成、便捷、可穿戴甚至植入。人机交互的未来发展趋势应该是交互的自然高效,形成高可用的自然交互技术,彻底实现人机融合,使得人类更高效的利用计算机这一集成工具。

未来可期。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT引发的人机交互发展历程与升级思考 的相关文章

  • 封装 视频以及监控组件

    1 引入插件 文件Git 地址 https gitee com wang xiaowang123 liveplayer html 文件中 liveplayer lib min js 文件在Git仓库中 2 封装组件 LivePlayerDe
  • 区块链共识协议最详细的分析

    共识机制是区块链的核心基石 是区块链系统安全性的重要保障 区块链是 一个去中心化的系统 共识机制通过数学的方式 让分散在全球各地成千上万的节点就区块的创建达成一致的意见 共识机制中还包含了促使区块链系统有效运 转的激励机制 是区块链建立信任

随机推荐

  • Web 请求过程剖析笔记

    1 服务器渲染 在服务器那边直接把数据和HTML整在一起 统一返回给浏览器 在页面源代码中看得到数据 2 客户端渲染 第一次请求只要一个 HTML 骨架 第二次请求拿到数据 进行数据显示 在页面源代码中看不到数据
  • LVS原理详解以及部署

    linux virtual server简称LVS Internet的快速增长使多媒体网络服务器面对的访问数量快速增加 服务器需要具备提供大量并发访问服务的能力 因此对于大负载的服务器来讲 CPU I O处理能力很快会成为瓶颈 由于单台服务
  • Cannot prompt because user interactivity has been disabled 问题处理

    问题描述 git 使用的是ssh访问的 配置好之后 拉取远程仓库没有问题 但是在项目中代码拉去项目私有仓库时 报 fatal Cannot prompt because user interactivity has been disable
  • 华为上机题7(四则运算)

    题目 输入一个只包含个位数字的简单四则运算表达式字符串 计算该表达式的值 注 3 1 表达式只含 四则运算符 不含括号 3 2 表达式数值只包含个位整数 0 9 且不会出现0作为除数的情况 3 3 要考虑加减乘除按通常四则运算规定的计算优先
  • C语言中从键盘输入字符串时的一些问题

    C语言中从键盘输入字符串时的一些问题 1 scanf scanf 在输入字符串时有很大的弊端 例如 1 scanf 在从键盘读入字符时并不会根据所定义的字符数组的大小来控制读入多少个 而是从scanf 中传入的地址开始一直访问下一个元素的内
  • HTTPS原理 如何实现安全通信

    目录 HTTP存在的问题 HTTPS原理 数字证书 CA可不可以用公钥加密服务器的公钥 参考 HTTPS理论基础及其在Android中的最佳实践 孙群的博客 CSDN博客 android httpshttps blog csdn net i
  • wazuh all in one 一步步部署

    Wazuh 是一个免费 开源和企业级的安全监控解决方案 用于威胁检测 完整性监控 事件响应和合规性 Adding the Wazuh repository yum install curl unzip wget libcap y rpm i
  • Java开发技巧!网上java培训师

    01 JAVA基础 1 1 java知识点 Hashmap 源码级掌握 扩容 红黑树 最小树化容量 hash冲突解决 有些面试官会提出发自灵魂的审问 比如为什么是红黑树 别的树不可以吗 为什么8的时候树化 4不可以吗 等等 concuree
  • 判断单链表是否有环,如何寻找环的入口结点

    今天我们来讨论一个有趣的链表问题 判断链表是否有环 如果有环 环的入口结点如何寻找 文章目录 1 如何判断一个单链表是否有环呢 2 如何找到环的入口结点 1 如何判断一个单链表是否有环呢 一个单链表如果有环 那它只可能是这样的 如下图所示
  • vue实现注册界面

    p 在 Vue 中实现注册界面可以分为以下几步 p ol li p 在组件中创建一个表单 用来输入用户名 密码 电子邮件等信息 p li li p 使用 Vue 的表单绑定特性 将表单中的输入绑定到组件的数据中 p li li p 创建一个
  • acc 蓝牙_蓝牙音频传输格式:ACC,SBC,APTX和LDAC

    ACC Advanced Audio Coding 高级音频编码 ACC是杜比实验室为音乐社区提供的技术 是一种高压缩比的编码算法 实际体验上都认为同样的码率下面 ACC的听感比MP3好 apple上面ACC的音频很多 所以现在的iphon
  • Qt之事件处理机制

    目录 一 事件简介 二 事件的处理 1 重写notify处理函数 2 事件过滤器 3 重写event处理函数 4 重写特定事件处理函数 三 事件的发送 一 事件简介 Qt 是一个基于 C 的框架 主要用来开发带窗口的应用程序 使用的基于窗口
  • SMP,NUMA,MPP

    一 概念介绍 SMP Symmetric Multi Processor 对称多处理器 NUMA Non Uniform Memory Access 非一致存储访问结构 MPP Massive Parallel Processing 海量并
  • exynos5410 TMU系统的critical情况处理方法

    根据TMU 将CPU的温升分为四种情况来处理 分别是下述情况 THERMAL TRIP HOT THERMAL TRIP ACTIVE THERMAL TRIP PASSIVE THERMAL TRIP CRITICAL THERMAL T
  • PhotoShop 快捷键及技巧

    复制图层 图层 新建 复制图层 图层上右键 点击复制图层 ctrl J 删除图层 选中图层 按del键删除图层 对图像实现自由变换 ctrl T 同过图像边框八个方块对图像实现大小变化 按回车键确认变换 按住shift键实现等比例变换 勾选
  • Python程序报错:TypeError: read() missing 1 required positional argument: ‘self‘

    文章目录 问题描述 问题定位 解决方法 总结 问题描述 最近在学习python面向对象执行调用方法时程序报错 TypeError read missing 1 required positional argument self 一看这个报错
  • 阿里Esay-excel解析复杂表头方案实际应用

    目录 我遇到的场景 思路 一 观察表格整体结构 二 设计数据结构 三 引入依赖 四 建立实体 五 实现自定义解析逻辑 六 业务调用 七 其他代码段 可以参考的链接 我遇到的场景 业务上需要读取表格中的所有数据 接着入库保存 思路 一 观察表
  • 获取地址栏url参数

    获取url携带参数 getUrlParams url var arr url split var params arr 1 split var obj for var i 0 i lt params length i var param p
  • 8. unity脚本参数输入、键盘控制、组件脚本调用

    1 脚本参数 在脚本文件中可以定义一些公开的属性 这时对应的属性也会在编辑器中显示出来 可以在编辑器中直接改动属性的值 如下代码 将 rotateSpeed 属性使用 public 修饰后 using System Collections
  • ChatGPT引发的人机交互发展历程与升级思考

    ChatGPT自从去年12月火爆以来一直热度不减 最近正好研读了科技之巅 书中详细阐述了人机交互 人工智能 算力算法等技术的发展历史 本文主要围绕ChatGPT引发的人机交互方面的思考 在讨论人机交互之前 首先需要说明的一点 目前计算机发展