深度学习 vs 概率图模型 vs 逻辑学

2023-11-08

深度学习 vs 概率图模型 vs 逻辑学

发表于 2015-04-30 21:55| 1359次阅读| 来源 quantombone| 0 条评论| 作者 Tomasz Malisiewicz
摘要:本文回顾过去50年人工智能(AI)领域形成的三大范式:逻辑学、概率方法和深度学习。文章按时间顺序展开,先回顾逻辑学和概率图方法,然后就人工智能和机器学习的未来走向做些预测。

【编者按】在上个月发表博客文章《深度学习 vs 机器学习 vs 模式识别》之后,CMU博士、MIT博士后及vision.ai联合创始人Tomasz Malisiewicz这一次带领我们回顾50年来人工智能领域三大范式(逻辑学、概率方法和深度学习)的演变历程。通过本文我们能够更深入地理解人工智能和深度学习的现状与未来。

以下为正文:

今天,我们一起来回顾过去50年人工智能(AI)领域形成的三大范式:逻辑学、概率方法和深度学习。如今,无论依靠经验和“数据驱动”的方式,还是大数据、深度学习的概念,都已经深入人心,可是早期并非如此。很多早期的人工智能方法是基于逻辑,并且从基于逻辑到数据驱动方法的转变过程受到了概率论思想的深度影响,接下来我们就谈谈这个过程。

本文按时间顺序展开,先回顾逻辑学和概率图方法,然后就人工智能和机器学习的未来走向做出一些预测。


图片来源:Coursera的概率图模型课

1. 逻辑和算法 (常识性的“思考”机)

许多早期的人工智能工作都是关注逻辑、自动定理证明和操纵各种符号。John McCarthy于1959年写的那篇开创性论文取名为《常识编程》也是顺势而为。

如果翻开当下最流行的AI教材之一——《人工智能:一种现代方法》(AIMA),我们会直接注意到书本开篇就是介绍搜索、约束满足问题、一阶逻辑和规划。第三版封面(见下图)像一张大棋盘(因为棋艺精湛是人类智慧的标志),还印有阿兰·图灵(计算机理论之父)和亚里士多德(最伟大的古典哲学家之一,象征着智慧)的照片。


AIMA 的封面,它是CS专业本科AI课程的规范教材

然而,基于逻辑的AI遮掩了感知问题,而我很早之前就主张了解感知的原理是解开智能之谜的金钥匙。感知是属于那类对于人很容易而机器很难掌握的东西。(延伸阅读:《计算机视觉当属人工智能》,作者2011年的博文)逻辑是纯粹的,传统的象棋机器人也是纯粹算法化的,但现实世界却是丑陋的,肮脏的,充满了不确定性。

我想大多数当代人工智能研究者都认为基于逻辑的AI已经死了。万物都能完美观察、不存在测量误差的世界不是机器人和大数据所在的真实世界。我们生活在机器学习的时代,数字技术击败了一阶逻辑。站在2015年,我真是替那些死守肯定前件抛弃梯度下降的傻子们感到惋惜。

逻辑很适合在课堂上讲解,我怀疑一旦有足够的认知问题成为“本质上解决”,我们将看到逻辑学的复苏。未来存在着很多开放的认知问题,那么也就存在很多场景,在这些场景下社区不用再担心认知问题,并开始重新审视这些经典的想法。也许在2020年。

延伸阅读:《逻辑与人工智能》斯坦福哲学百科全书

2. 概率,统计和图模型(“测量”机)

概率方法在人工智能是用来解决问题的不确定性。《人工智能:一种现代方法》一书的中间章节介绍“不确定知识与推理”,生动地介绍了这些方法。如果你第一次拿起AIMA,我建议你从本节开始阅读。如果你是一个刚刚接触AI的学生,不要吝啬在数学下功夫。


来自宾夕法尼亚州立大学的概率论与数理统计课程的PDF文件

大多数人在提到的概率方法时,都以为只是计数。外行人很容易想当然地认为概率方法就是花式计数方法。那么我们简要地回顾过去统计思维里这两种不相上下的方法。

频率论方法很依赖经验——这些方法是数据驱动且纯粹依靠数据做推论。贝叶斯方法更为复杂,并且它结合数据驱动似然和先验。这些先验往往来自第一原则或“直觉”,贝叶斯方法则善于把数据和启发式思维结合做出更聪明的算法——理性主义和经验主义世界观的完美组合。

最令人兴奋的,后来的频率论与贝叶斯之争,是一些被称为概率图模型的东西。该类技术来自计算机科学领域,尽管机器学习现在是CS和统计度的重要组成部分,统计和运算结合的时候它强大的能力才真正释放出来。

概率图模型是图论与概率方法的结合产物,2000年代中期它们都曾在机器学习研究人员中风靡一时。当年我在研究生院的时候(2005-2011),变分法、Gibbs抽样和置信传播算法被深深植入在每位CMU研究生的大脑中,并为我们提供了思考机器学习问题的一个极好的心理框架。我所知道大部分关于图模型的知识都是来自于Carlos Guestrin和Jonathan Huang。Carlos Guestrin现在是GraphLab公司(现改名为Dato)的CEO,这家公司生产大规模的产品用于图像的机器学习。Jonathan Huang现在是Google的高级研究员。

下面的视频尽管是GraphLab的概述,但它也完美地阐述了“图形化思维”,以及现代数据科学家如何得心应手地使用它。Carlos是一个优秀的讲师,他的演讲不局限于公司的产品,更多的是提供下一代机器学习系统的思路。


概率图模型的计算方法介绍(视频和PPT下载

Dato CEO,Carlos Guestrin教授

如果你觉得深度学习能够解决所有机器学习问题,真得好好看看上面的视频。如果你正在构建一套推荐系统,一个健康数据分析平台,设计一个新的交易算法,或者开发下一代搜索引擎,图模型都是完美的起点。

延伸阅读:

置信传播算法维基百科

图模型变分法导论

Michael Jordan的技术主页(Michael Jordan系推理和图模型的巨头之一)

3. 深度学习和机器学习(数据驱动机)

机器学习是从样本学习的过程,所以当前最先进的识别技术需要大量训练数据,还要用到深度神经网络和足够耐心。深度学习强调了如今那些成功的机器学习算法中的网络架构。这些方法都是基于包含很多隐藏层的“深”多层神经网络。注:我想强调的是深层结构如今(2015年)不再是什么新鲜事。只需看看下面这篇1998年的“深层”结构文章。


LeNet-5,Yann LeCun开创性的论文《基于梯度学习的文档识别方法》

你在阅读LeNet模型导读时,能看到以下条款声明:

要在GPU上运行这个示例,首先得有个性能良好的GPU。GPU内存至少要1GB。如果显示器连着GPU,可能需要更多内存。

当GPU和显示器相连时,每次GPU函数调用都有几秒钟的时限。这么做是必不可少的,因为目前的GPU在进行运算时无法继续为显示器服务。如果没有这个限制,显示器将会冻结太久,计算机看上去像是死机了。若用中等质量的GPU处理这个示例,就会遇到超过时限的问题。GPU不连接显示器时就不存在这个时间限制。你可以降低批处理大小来解决超时问题。

我真的十分好奇Yann究竟是如何早在1998年就把他的深度模型折腾出一些东西。毫不奇怪,我们大伙儿还得再花十年来消化这些内容。

更新:Yann说(通过Facebook的评论)ConvNet工作可以追溯到1989年。“它有大约400K连接,并且在一台SUN4机器上花了大约3个星期训练USPS数据集(8000个训练样本)。”——LeCun


深度网络,Yann1989年在贝尔实验室的成果

注:大概同一时期(1998年左右)加州有两个疯狂的家伙在车库里试图把整个互联网缓存到他们的电脑(他们创办了一家G打头的公司)。我不知道他们是如何做到的,但我想有时候需要超前做些并不大规模的事情才能取得大成就。世界最终将迎头赶上的。

延伸阅读:

Y.LeCun, L.Bottou, Y.Bengio, and P.Haffner.Gradient-based learning applied to document recognition.Proceedings of the IEEE, November 1998.

Y.LeCun, B.Boser, J.S.Denker, D.Henderson, R.E.Howard, W.Hubbard and L.D.Jackel: Backpropagation Applied to Handwritten Zip Code Recognition, Neural Computation, 1(4):541-551, Winter 1989

Deep Learning code: Modern LeNet implementation in Theano and docs.

结论

我没有看到传统的一阶逻辑很快卷土重来。虽然在深度学习背后有很多炒作,分布式系统和“图形思维”对数据科学的影响更可能比重度优化的CNN来的更深远。深度学习没有理由不和GraphLab-style架构结合,未来几十年机器学习领域的重大突破也很有可能来自这两部分的结合。

原文链接: Deep Learning vs Probabilistic Graphical Models vs Logic (翻
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习 vs 概率图模型 vs 逻辑学 的相关文章

  • 12 papers to understand QA system with Deep Learning

    由于最近入手NLP任务 需要看一些paper 本文对最近两周看的paper做个总结 适用于有deep learning背景 希望了解NLP应用的同学 主要针对NLP方向 问答系统 QA 和翻译 Machine Translation 本文提
  • 主成分分析(Principal Component Analysis,PCA)详解

    PCA是非常重要的统计方法 其实际应用非常广泛 但是很多讲解太过于公式化 很难让初学者消化 本文将从一个实际例子出发 并对数学公式原理及推导过程作出详细解释 即使你的数学基础比较差 在看完这篇博客之后 相信你会对PCA会有一个透彻的认知 P
  • 【神经网络】神经网络架构大全剖析(附原始论文地址)

    随着新的神经网络架构不时出现 很难跟踪这些架构 知道所有缩写 DCIGN BiLSTM DCGAN anyone 起初可能有点压倒性 所以我决定编写一个包含许多这些体系结构的备忘单 这些大多数是神经网络 有些是完全不同的野兽 虽然所有这些体
  • 机器学习、深度学习、图像检索 的一些优秀博客

    机器学习 深度学习 图像检索 的一些优秀博客 1 http www cnblogs com ooon 2 http yongyuan name blog
  • R资源大全

    0 前言 虽然很早就知道R被微软收购 也很早知道R在统计分析处理方面很强大 开始一直没有行动过 直到 直到12月初在微软技术大会 看到我软的工程师演示R的使用 我就震惊了 然后最近在网上到处了解和爬一些R的资料 看着看着就入迷了 这就是个大
  • 西瓜书之误差逆传播公式推导、源码解读及各种易混淆概念

    关键词 反向传播 BP caffe源码 im2col 卷积 反卷积 上池化 上采样 公式推导 以前看到一长串的推导公式就想直接跳过 今天上午莫名有耐心 把书上的公式每一步推导自己算一遍 感觉豁然开朗 遂为此记 sigmoid函数求导比rel
  • 机器学习——深度学习(Deep Learning)

    Deep Learning是机器学习中一个非常接近AI的领域 其动机在于建立 模拟人脑进行分析学习的神经网络 最近研究了机器学习中一些深度学习的相关知识 本文给出一些很有用的资料和心得 Key Words 有监督学习与无监督学习 分类 回归
  • 聚类五之总结

    1 聚类方法的选择 1 对于数据量较大的情况 k means 2 对于数据量较一般的情况 最大密度聚类 DBSCAN 3 对于数据量较少的情况 谱聚类 2 类别数目k未知 且数据有噪声 可使用密度聚类 如DBSCAN 最大密度聚类 DBSC
  • 训练模型的3种方法

    公众号后台回复关键字 Pytorch 获取项目github地址 Pytorch没有官方的高阶API 一般通过nn Module来构建模型并编写自定义训练循环 为了更加方便地训练模型 作者编写了仿keras的Pytorch模型接口 torch
  • 感知机(Perceptron)-----最详细记录感知机

    1 前言 感知机是1957年 由Rosenblatt提出会 是神经网络和支持向量机的基础 感知机是有生物学上的一个启发 他的参照对象和理论依据可以参照下图 我们的大脑可以认为是一个神经网络 是一个生物的神经网络 在这个生物的神经网络里边呢
  • 关于二阶锥优化(SOCP)的学习

    原来 数学不好的时候 真的很难深入下去做研究 最近的两个月时间里 我就边学习SOCP相关的理论知识 一边拿它当工具来分析多视角几何中的问题 包括Triangulation Homography Estimation等 接触到SOCP的起因在
  • pandas中的时间序列

    一 夯实基础 datetime 模块中的数据类型 date 以公历形式存储日历日期 年月日 time 将时间存储为时分秒毫秒 datetime 存储日期和时间 timedelta 表示两个datetime值之间的差 日 秒 毫秒 1 获取当
  • 【机器学习详解】SVM解二分类,多分类,及后验概率输出

    转载请注明出处 http blog csdn net luoshixian099 article details 51073885 CSDN 勿在浮沙筑高台 color Blue CSDN 21247 22312 28014 27801 3
  • confidence weighted learning

    这个算法原作者意思是在NLP中面对高维向量和数据稀疏时效果会不错 算法保持了当前预测向量w的均值和方差 并做优化 代码实现如下 cw learning algorithm def get phi confidence parameter p
  • 异常检测(二)——IsolationForest

    1 简介 孤立森林 Isolation Forest 是另外一种高效的异常检测算法 它和随机森林类似 但每次选择划分属性和划分点 值 时都是随机的 而不是根据信息增益或者基尼指数来选择 在建树过程中 如果一些样本很快就到达了叶子节点 即叶子
  • 基于产品的RFM模型的k-means聚类分析

    首先我们可以看看数据集的数据形态 导入rfm数据 查看数据的统计学参数 df pd read csv rfm csv df describe 在实施Kmeans聚类之前 我们必须检查这些关键k means假设 变量对称分布 不倾斜 具有相同
  • MLOps极致细节:4. MLFlow Projects 案例介绍(Gitee代码链接)

    MLOps极致细节 4 MLFlow Projects 案例介绍 Gitee代码链接 MLFlow Projects允许我们将代码及其依赖项打包为一个可以在其他平台上以可复制 reproducible 和可重用 reusable 的方式运行
  • 【nlp-with-transformers】

    今天社群中的小伙伴面试遇到了一个问题 如何保证生成式语言模型在同样的输入情况下可以保证同样的输出 这里面造成问题的因素有两个方面 一个方面是在forward过程中参数的计算出现了差异 这种情况一般发生在游戏显卡中 游戏显卡无法保证每一次底层
  • 广义线性模型(GLM)

    在线性回归中 y丨x N 2 在逻辑回归中 y丨x Bernoulli 这两个都是GLM中的特殊的cases 我们首先引入一个指数族 the exponential family 的概念 如果一个分布能写成下列形式 那么我们说这个分布属于指
  • 吴恩达机器学习笔记系列(五)——梯度下降

    一 gradient descent 梯度下降 1 概念 线性回归的目的就是找出使得误差 损失函数 最小的参数值 可以用梯度下降来确定 参数的大小 梯度下降是一种迭代方法 能够求解局部最小值 结果与初始点的选取有关 为了找到最小值 从某一点

随机推荐

  • 非递归方式实现二叉树的前、中、后序遍历

    各位朋友们 大家五一快乐 今天我为大家分享的是不用递归的方式实现二叉树的前 中 后序遍历 一起来看看吧 文章目录 二叉树的前序遍历 二叉树的中序遍历 二叉树的后序遍历 二叉树的前序遍历 虽然我们说的是不用递归的方式实现 但是我们的思路还是模
  • Qt基础之三十五:Qt中文乱码探索

    先说个小技巧 Qt Creator支持显示源文件编码格式 右上角点UTF 8 会弹出 文件编码 对话框 我的开发环境是Win10 Qt5 12 6 VS2017 IDE是Qt Creator Qt中乱码为何总显示为问号呢 要彻底理解乱码问题
  • how to debug webkit

    1 编译带debug 信息的webkit 库 删除qt everywhere opensource src 4 7 0 src 3rdparty webkit WebCore WebCore pro 中的红色两行代码 还有JavaScrip
  • JVM常见命令之jmap

    一 jmap是一个很重要的命令 可以查看JVM内存使用情况 1 jmap help 帮助文档 参数解释 option 选项参数 pid 需要打印配置信息的进程ID executable 产生核心dump的Java可执行文件 core 需要打
  • 618京东到家APP-门详页反爬实战

    一 背景与系统安全需求分析 1 系统的重要性 上图所示是接口所属位置 对电商平台或在线商店而言 分类查商品都是很重要的 通过为用户提供清晰的商品分类 帮助他们快速找到所需产品 节省浏览时间 提升购物效率 是购物结算产生GMV的核心环节 那么
  • 软链接与硬链接的区别

    软连接与硬链接的区别 1 符号链接又叫软链接 和原文件不是一个文件 例如Windows的快捷方式 如果原始文件被删除 所有指向它的符号链接也就都被破坏了 符号链接记录的是目标的path 符号链接可以跨越文件系统 也可以为目录建立 软链接有自
  • 7天物联网智能家居实战-DAY7

    本课程时长七天 共计七次更新 文章目录 前言 1 课程内容 前言 这是七天物联网智能家居训练营的最后一节课了 整个课程可以说是从零开始 稳扎稳打 在七天这样一个很短的时间尺度上 确实能从毫无概念 到搭建一个基本的工程并在开发板上实现具体的功
  • chmod无法修改权限的问题

    linux 下挂载windows ntfs 硬盘 采用开机挂载 修改 etc fstab 添加一行 UUID 000XXXFxXXX1 media lanyang document ntfs defaults uid lanyang gid
  • VectorDraw Developer Framework 10.1004 Crack

    VectorDraw 开发人员框架 VDF 是一个图形引擎库 开发人员可以使用它来可视化其应用程序 通过提供的功能 我们的客户可以轻松创建 编辑 管理 导出 导入和打印 2D 和 3D 绘图 图形文件 VDF 使用的强大格式称为 VDML
  • 解决python-kafka连接kafka时报错kafka.errors.NoBrokersAvailable: NoBrokersAvailable

    完整报错 Traceback most recent call last File Applications PyCharm app Contents plugins python helpers pydev pydevd py line
  • 华为od机试-最多几个直角三角形

    题目描述 有N条线段 长度分别为a 1 a n 现要求你计算这N条线段最多可以组合成几个直角三角形 每条线段只能使用一次 每个三角形包含三条线段 输入描述 第一行输入一个正整数T 1 lt T lt 100 表示有T组测试数据 对于每组测试
  • 基于神经网络的图像人体轮廓提取(一些经验)

    神经网络提取人体轮廓经验 神经网提取轮廓从我做过的角度来说的话 我认为可以分为三个部分 第一个部分是对人体的分割提取 第二使用边缘提取算子例如canny算子对人体轮廓进行粗略计算 第三部分 使用形态学及相关算法对轮廓图像进行修改 去除杂点
  • Open3D (C++) 基于拟合平面的点云地面点提取

    目录 一 算法原理 1 原理概述 2 参考文献 二 代码实现 三 结果展示 1 原始点云 2 提取结果 四 相关链接 系列文章 连载中 Open3D C 基于高程的点云地面点提取 Open3D C 基于拟合平面的点云地面点提取 Open3D
  • IIS 运行bat文件,实现动态网站的建立

    前言 我的感觉是这篇博客写出来 也没人会看 因为在这个过程中我遇到了很多困难 很难找到解决办法 我解决的过程都是分解问题找相似的解决办法 但是仍然找了很久 问题的初遇 要说这个问题是怎么想出来的 那我自然不会这么无聊而且有本事想出这个问题
  • 我是如何把SpringBoot项目的并发提升十倍量级的

    背景 生产环境偶尔会有一些慢请求导致系统性能下降 吞吐量下降 下面介绍几种优化建议 方案 1 undertow替换tomcat 电子商务类型网站大多都是短请求 一般响应时间都在100ms 这时可以将web容器从tomcat替换为undert
  • 如何保证接口安全,做到防篡改防重放?

    对于互联网来说 只要你系统的接口暴露在外网 就避免不了接口安全问题 如果你的接口在外网裸奔 只要让黑客知道接口的地址和参数就可以调用 那简直就是灾难 举个例子 你的网站用户注册的时候 需要填写手机号 发送手机验证码 如果这个发送验证码的接口
  • 在Win10系统中用mimikatz抓取明文密码

    实验环境 Windows10专业版 参考了网上的方法 发现大部分都是抄的 https blog csdn net netsec steven article details 107257325 这一篇文章 都被转烂了 这一篇文章是对的 但是
  • 双层pdf-不用手动添加目录超链接教程

    双层pdf最大的特点是文件既可以是文本型的 比如由word生成的文件 也可以是图像型的 既可以100 保留原始版面效果 又便于建立索引数据库 进行科学的管理 在标书中应用广泛 使用软件 word Adobe Acrobat DC 以前生成双
  • 使用VsCode进行webpack打包

    前言 折腾了两天 折腾的有点伤心 以往的项目是站在大树地下使用框架自带的打包框架 当自己用webpack来实现自动打包的时候却发现 各种红 当自己把环境搭建好写出第一个demo的时候就发现这些过程都是很经验的积累吧 第一步 确保安装node
  • 深度学习 vs 概率图模型 vs 逻辑学

    深度学习 vs 概率图模型 vs 逻辑学 发表于 2015 04 30 21 55 1359次阅读 来源 quantombone 0 条评论 作者 Tomasz Malisiewicz 深度学习 deep learning 图模型 人工智能