机器学习顶刊文献_哪些成为了经典-引用次数最多的10篇机器学习文献

2023-11-12

近40年来机器学习领域产生了数以万计的论文,并以每年上万篇的速度增长。但真正能够称为经典、经受住历史检验、能投入实际应用的并不多。本文整理了机器学习历史上出现的经典论文,按照被引用次数对它们进行了排序,分为top10,被引用次数超过2万,被引用次数超过1万,未来有潜力的文章4部分。它们已经或者在未来具有资格被写入机器学习、深度学习、人工智能的教科书,是一代又一代研究人员为我们留下的宝贵财富。需要说明的是,引用次数对近几年新出现的文章是不公平的,它们还处于高速增长期,但好酒就是好酒,随着时间的沉淀会越来越香。

引用次数最高的10篇文献

第1名-EM算法

Arthur P Dempster, Nan M Laird, Donald B Rubin. Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the royal statistical society series b-methodological, 1976.

被引用次数:55989

令笔者惊讶的是排名第一的居然不是支持向量机,集成学习,深度学习,决策树等历史上赫赫有名的算法,而是EM。这是EM算法的原文,引用次数高达5万多!EM算法在很多版本的排名中都被称为机器学习的10大算法之一。它在数学上优美,实现起来也很简单,是求解含有隐变量的最大似然估计、最大后验概率估计的有力工具,在高斯混合模型,隐马尔可夫模型等问题上得到了成功的应用。在SIGAI之前的公众号文章“理解EM算法”中对其原理进行了详细的介绍。

第2名-logistic回归

David W Hosmer, Stanley Lemeshow. Applied logistic regression. Technometrics. 2000.

被引用次数:55234

代表了线性模型这一山头。这不是logistic回归的原文,logistic回归在这之前几十年就已经被提出,但这篇文献的引用次数却达到了,虽然它不是论文而是书的形式,但其引用次数比著名的PRML还要高。这也符合我们的直观认识,logistic回归虽然简单,但却实用,在工程上,往往是越简单的东西越有用。

第3名-随机森林

Breiman, Leo. Random Forests. Machine Learning 45 (1), 5-32, 2001.

被引用次数:42608

代表了集成学习这一大山头。Breiman的随机森林,分类与回归树分列第3/4名。而随机森林的排名比AdaBoost算法要高。同样的,随机森林也很简单,但却好用。在SIGAI之前的公众号文章“随机森林概述”中对集成学习,bagging,随机森林进行了详细的介绍。

第4名-分类与回归树

Breiman, L., Friedman, J. Olshen, R. and Stone C. Classification and Regression Trees, Wadsworth, 1984.

被引用次数:39580

这是分类与回归树的原文,代表了决策树这一山头。在各种决策树中,分类与回归树(CART)应当是用的最广的,现在还被用于充当随机森林,AdaBoost,梯度提升算法的弱学习器。Breiman老爷子在2005年已经逝去,但他留给我们大片的树和森林。在SIGAI之前的公众号文章“理解决策树”中对这一算法进行了详细的介绍。

第5名-支持向量机开源库libsvm

C.-C. Chang and C.-J. Lin. LIBSVM: a Library for Support Vector Machines. ACM TIST, 2:27:1-27:27, 2011.

被引用次数:38386

这篇文章介绍了libsvm开源库。引用次数超过了支持向量机的原文,应该算是公开的最经典的支持向量机实现,其作者是台湾大学林智仁

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习顶刊文献_哪些成为了经典-引用次数最多的10篇机器学习文献 的相关文章

  • 虚拟化磁盘模式、数据存储详解

    虚拟化磁盘模式 数据存储详解 1 配置模式 1 1 普通 1 2 普通延迟置零 1 3 精简 2 磁盘模式 2 1 从属 2 2 独立 持久 2 3 独立 非持久 3 数据存储 3 1 虚拟化类型数据存储 3 2 非虚拟化类型数据存储 3
  • Web和HTTP

    目录 HTTP概况 Web术语 HTTP基本 HTTP是无状态协议 HTTP连接方式 非持续连接HTTP 例子 花费时间 持续连接的HTTP 非持续的缺点 HTTP报文格式 请求报文 HTTP请求报文的通用格式 及GET POST HEAD
  • 性能测试基础

    性能测试基础知识 性能测试的定义 衡量软件的性能需要考虑的三点内容 性能测试的分类 压力测试 负载测试 容量测试 强度测试 配置测试 基准测试 并发测试 性能指标 响应时间 吞吐量 服务器资源占用 以下内容比较枯燥 但是作为基础无法绕开 就
  • Kuebernetes之DaemonSet

    DaemonSet确保集群中每个 部分 node运行一份pod副本 当node加入集群时创建pod 当node离开集群时回收pod 如果删除DaemonSet 其创建的所有pod也被删除 DaemonSet中的pod覆盖整个集群 当需要在集
  • SpringBoot项目实现增删改查

    接上一章 Java 连接MySql 原你是阳光 O 的博客 CSDN博客 实现单表增删改查 引入依赖
  • JVM调优

    1 JVM运行时数据区 2 基础 1 类加载器 2 双亲委派 2 沙箱机制 3 垃圾回收算法 1 引用计数 2 复制 3 标记清除 4 标记整理 4 GCRoot 1 虚拟机栈中的引用对象 2 方法区中的类静态属性引用的对象 3 方法区中的
  • Python课堂练习

    文章目录 1 用for循环来计算1 2 3 100 2 用for循环来计算1 3 5 99 3 百钱买百鸡问题 采用三重循环 4 百钱买百鸡问题2 采用三重循环 5 采用for算令狐大侠喝了多少酒 6 采用for循环遍历序列 sequenc
  • Ubuntu升级python版本

    Ubuntu18 04的python3版本太低了 默认的python3版本为python3 6 我在安装mavros的时候 有一个包sympy需要 gt 1 10以上 但是需要的python版本为python3 8及更新版本 所以我就想把我
  • vue 假期工作日设置_假期申请第8天2月25日

    vue 假期工作日设置 It s that time again project week 又是时候了 项目周 This time around the project week started on Monday August 24th
  • centos7换源

    1 首先备份系统自带yum源配置文件 etc yum repos d CentOS Base repo mv etc yum repos d CentOS Base repo etc yum repos d CentOS Base repo
  • import cv2出现“ImportError: DLL load failed: 找不到指定的模块”

    2 1 将cv2 cp36 win amd64 pyd 文件复制一份 防止一会儿改完不行 又不知道原来是什么了 更改内容如下 import importlib from cv2 import 前面去掉点之后变成这样 from data im
  • 一文让你彻底了解Linux内核文件系统

    一 文件系统特点 文件系统要有严格的组织形式 使得文件能够以块为单位进行存储 文件系统中也要有索引区 用来方便查找一个文件分成的多个块都存放在了什么位置 如果文件系统中有的文件是热点文件 近期经常被读取和写入 文件系统应该有缓存层 文件应该
  • 用Go构建一个简单的区块链

    在本教程中 我将尝试通过帮助你在Go中编写简单的区块链来揭开区块链的广义概念 在本教程中 你应该能够 理解区块链术语 创建自己的简单区块链 了解什么是区块以及如何创建块 了解如何维护区块链的完整性 区块链 一种数字分类帐 以较小的集合排列
  • 数据诊断模型,该怎么搭建?

    你会用数据下判断吗 你怎么确定你的判断是准确的 现在业务说你判断错了 你怎么应对 用数据下判断 是看似简单 实则极大影响数据分析结果的一个问题 同样是本月销售业绩1000万 如果判断是 业绩很好 那么下一步的分析就是总结成功经验 如果判断是
  • 悟空crm php 部署,悟空crm开源版本环境搭建

    安装步骤 JDK需要预先安装 下载后执行install sh 链接 link 硬件配置 因为只有一台机器所以安装在一台机器上了 cpu 内存 硬盘 系统 8核 32G ssd100G centos7 基础软件 mysql安装 1 卸载mar
  • DataGrip数据库连接失败:DBMS: MySQL (无版本)区分大小写: 普通形式=mixed, 分隔形式=exactConnection refused: connect.

    查看任务管理器 服务 mysql服务是否正在运行 右键可控制关闭运行
  • 如何查看视图的sql语句

    select text from syscomments s1 join sysobjects s2 on s1 id s2 id where name 视图名称 前提条件是视图没有被加密 有权限 转载于 https www cnblogs
  • Flink on Zeppelin-1

    准备工作 下载Zeppelin 0 9 0 preview1 或者下载 除了下载Flink的标准release 如果你要使用Flink on Yarn模式或者连接Hive 那么你还需要下载其他Flink组件 flink hadoop com
  • AutoGPT太火了,无需人类插手自主完成任务,ChatGPT 已经过时了?

    转载自 机器之心Pro 原文链接 AutoGPT太火了 无需人类插手自主完成任务 GitHub2 7万星 OpenAI 的 Andrej Karpathy 都大力宣传 认为 AutoGPT 是 prompt 工程的下一个前沿 近日 AI 界

随机推荐

  • Vue3 解决电脑分辨率及缩放导致页面变形的问题

    Vue3 解决电脑分辨率不同导致的页面变形问题 前言 电脑缩放问题解决 屏幕分辨率问题解决 前言 最近在做一个项目 突然发现由于调整电脑的分辨率导致页面变形的问题 正常电脑显示的是100 当调整电脑缩放至125 时 页面发生变形 由于css
  • springboot相关图形

    一 springboot的需求调研 需求分析 即应用场景 开发中如果使用spring springmvc spring集成第三方框架 如springmvc mybatis等 都需要编写大量的xml配置文件 二 框架的设计思想 不需要配置文件
  • Apache Kafka Deep 解析

    1 首先了解主题 经纪人 生产者和消费者等主要术语 下图说明了主要术语 表格详细描述了图表组件 在上图中 主题配置为三个分区 分区1具有两个偏移因子0和1 分区2具有四个偏移因子0 1 2和3 分区3具有一个偏移因子0 副本的id与承载它的
  • c++输出爱心小程序

    输入数值可以得到不同大小的爱心形状 include
  • STM32——FATFS文件基础知识

    一 探索者STM32开发板 通过底面的SD卡接口与SD卡连接 硬件连接原理图 PC8 9 11分时 二 SD卡驱动代码 1 SD Init初始化函数 2 SD ReadDisk读函数 3 SD WriteDisk写函数 1 文件系统是什么
  • @RequestHeader注解详解

    SpringMVC提供了 RequestHeader注解 可以将请求头中变量值映射到控制器的参数中 如下例子 将请求头中的变量值token映射到控制器参数token中 GetMapping checkUserLoginInfo public
  • Linux骚操作第十七话之PAM验证、sudo和开关机控制等

    文章目录 前言 一 PAM安全认证流程 二 提权 三 开关机安全控制 四 系统弱口令检测 五 网络端口扫描 总结 前言 在工作环境中 一些用户的权限都是由root系统管理员通过sudo放权给予 这样做的好处是防止某些用户存在故意之心 破坏系
  • Git:利用Git进行多人协作的场景模拟

    文章目录 场景一 场景二 解决一些后续问题 场景一 Git是一个多人协作下完成的操作 因此Git是需要进行一些多人协作的场景的 那么这里就使用Linux和Windows两个平台进行模拟实现两个用户进行的协作 首先把仓库克隆到本地 再加入两个
  • LVGL学习笔记 21 - 图像Image

    目录 1 图像来源 1 1 图片源文件 1 2 颜色格式 1 2 1 LV IMG CF ALPHA 1 2 4 8BIT 1 2 2 LV IMG CF INDEXED 1 2 4 8BIT 1 2 3 LV IMG CF RAW ALP
  • Wireshark基础使用,SSL解密及http抓包入门教程

    Wireshark VS Fiddler Charles 一 下载与安装 二 抓取https等解密 三 报文传输各层简要介绍 Wireshark VS Fiddler Charles Wireshark功能很多 作用效果很底层 并且可以监听
  • 原码, 反码, 补码 详解

    本篇文章讲解了计算机的原码 反码和补码 并且进行了深入探求了为何要使用反码和补码 以及更进一步的论证了为何可以用反码 补码的加法计算原码的减法 论证部分如有不对的地方请各位牛人帮忙指正 希望本文对大家学习计算机基础有所帮助 一 机器数和真值
  • 人工智能数学基础--导数2:高阶导数及莱布尼茨(Leibniz)公式

    一 定义 一般地 函数y f x 的导数y f x 仍然是x的函数 我们把y f x 的导数叫做函数y f x 的二阶导数 记作y 或 即 相应地 把y f x 的导数f x 叫做函数y f x 的一阶导数 类似地 二阶导数的导数叫做三阶导
  • 新一代CTO修炼之路all-in-AI系列-大数据+AI人工智能驱动技术变革之大数据部门组织架构及团队建设

    文章目录 1 2 1大数据部门组织架构 1 大数据平台组 2 算法组 3 数据分析组 4 更细化的大数据部门划分 总结 随着大数据和人工智能技术的火热发展 传统的老一代CTO 除了有过硬的工程能力外 尚需充电学习大数据和AI人工智能技术 大
  • Qt6教程之三(2) QT使用qss

    QSS是Qt Style Sheets的缩写 中文含义是Qt样式表 它用来自定义控件外观的机制 QSS与网页中使用的CSS非常相似 可以把QSS看作是CSS在Qt领域领域的定制版本 QSS的语法规则 选择器 规则定义1 规则2 规则n 如下
  • Docker Swarm 创建服务

    Docker Swarm 创建服务 环境 系统 Centos 7 4 x64 应用版本 Docker 18 09 0 管理节点 192 168 1 79 工作节点 192 168 1 78 工作节点 192 168 1 77 1 管理节点
  • LeetCode 1800. 最大升序子数组和

    题目链接 https leetcode cn problems maximum ascending subarray sum 时间复杂度为 O n O n O n 空间复杂度为 O
  • 大学生科技创意大赛查新报告

    大学生科技创意大赛是什么 太多种类分不清 快来看 大学生科技创意大赛需要查新怎么办 去哪儿能办 大学生科技创意大赛的查新需要准备什么材料 大学生科技创意大赛科技查新报告是什么样子的 一 大学生科技创意大赛是什么 太多种类分不清 快来看 大学
  • 如何获取使用某个table的所有存储过程

    select distinct object name id from syscomments where id in select object id from sys objects where type P and text like
  • 目标识别、目标跟踪算法总结

    想自学图像处理的相关知识 正好实验室师兄做过两个关于红外目标跟踪的项目 因此从mean shift SR RP PF开始学习 但是查阅资料的时候 发现对各种算法理解非常 利用图像处理算法 实现的功能一般包括 目标的检测 识别 跟踪 常见的问
  • 机器学习顶刊文献_哪些成为了经典-引用次数最多的10篇机器学习文献

    近40年来机器学习领域产生了数以万计的论文 并以每年上万篇的速度增长 但真正能够称为经典 经受住历史检验 能投入实际应用的并不多 本文整理了机器学习历史上出现的经典论文 按照被引用次数对它们进行了排序 分为top10 被引用次数超过2万 被